北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
Nvidia’s GM200 is Down on FP64 Performance Alleges Report(WCCF Tech)
Hardware and communications links of the 7th / 8th February 2015(3DCenter.org / ドイツ語)

3DCetner.orgのforumに投稿された情報によると、GM200は倍精度浮動小数点演算ユニットを搭載していない、もしくは今までの同クラスのエンスージアスト向けGPUと比較して倍精度浮動小数点演算性能が極めて低い可能性があるという。だがにわかには信じがたく、今後の情報が待たれる。
 
倍精度浮動小数点演算ユニットの無効化にはメリットもあればデメリットもある。Professional向けでは主要な引数? (argument) が使えなくなる。一方、ゲーマー向けでは純粋なゲーム向けGPUとなることにより、タスクの効率がより高くなる。

ところがこの話の発生元は昨年12月25日の4Gamer.netの記事のようです。この記事の中でNVIDIAの林憲一氏 (プラットフォームビジネス本部部長) が、Teslaにおける“Kepler”世代から“Maxwell”世代への切り替えについて否定し「Maxwellは倍精度(浮動小数点演算ユニット)がないのでTeslaのような形で使われることはない。(次に)倍精度が入るのはPascalになる」と発言しています。
今現在の公式な情報としてはTesla向けの“Maxwell”は考えられていない、ということになりそうですが、3DCenter.orgも指摘しているとおり、この語の情報が待たれます「純粋なゲーム向け」でGK110よりも大きい高コストなGPUを作るものなのだろうかという疑問もある。少なくとも前例はないはずである



PCパーツの通販は・・・
ソフマップicon 1's TSUKUMO ネットショップ ドスパラ パソコン工房

コメント
この記事へのコメント
147159 
予想だけど、Pascal=Maxwell+HBM+DPってことはないだろうか?
2015/02/12(Thu) 23:10 | URL | LGA774 #9zOzYU0I[ 編集]
147160 
モバイルからハイパフォーマンスまでアーキ統一してたらマジで倍精度ないかもね
今のところGPGPU市場じゃ敵なしだしMaxwell世代で手を抜いたって
相手が相手だから別にいいって考えなのかもしれない

どうせゲーマーが倍精度使うことなんてないからね
コンシューマーで倍精度が輝く場面なんざ仮想通貨のマイニングぐらいだ
2015/02/12(Thu) 23:29 | URL | LGA774 #-[ 編集]
147161 
28nmだとGM204(400mm)の1.5倍の性能のGPUを作ったらそれだけで600mm近くなってしまうから
さらに倍精度演算器が入る余裕はないはず
2015/02/12(Thu) 23:41 | URL | LGA774 #-[ 編集]
147170 
エンドユーザーレベルだとVGAから使うGPGPUの恩恵はほぼ皆無だし
結構思い切った英断かな
2015/02/13(Fri) 07:10 | URL | LGA774 #-[ 編集]
147171 
状況が変わったんじゃないの?
よくあるはなしでしょ
2015/02/13(Fri) 07:14 | URL | LGA774 #-[ 編集]
147173 
28nmでDP乗せる余裕が無いだけ
それでもHPC以外には広く使われるんだけどね
2015/02/13(Fri) 07:59 | URL | LGA774 #-[ 編集]
147174 
>今のところGPGPU市場じゃ敵なし
どこの世界の話?
元記事にはGreen500でKeplerがHawaiiに負けてるって思いっきり書かれてるんだけど?
ついでに倍精度が遅すぎるMaxwellはビデオゲームにはいいが、プロフェッショナルなアプリケーションでは話にならないともね
2015/02/13(Fri) 08:20 | URL | LGA774 #-[ 編集]
147175 
マイニングって750Tiがワット効率良かったし倍精度必要ないんでは?
2015/02/13(Fri) 09:44 | URL | LGA774 #-[ 編集]
147177 
NVIDIAはTeslaをワークステーションにも売り込んでるのに対して
AMDはFireProのワークステーション用とサーバ用と位置付けてるという違いもあるな。
2015/02/13(Fri) 13:40 | URL | LGA774 #-[ 編集]
147178 
GK110のDPはゲーマーには無駄なトランジスタだからGM200のDP無し仕様は嬉しい
2015/02/13(Fri) 14:12 | URL | LGA774 #-[ 編集]
147179 
GeForceとQuadroが完全に別物になるワケだ。
2015/02/13(Fri) 14:44 | URL | LGA774 #-[ 編集]
147180 
まず、メモリの圧縮効果は無い。また、恐らくKepler->Maxwellは
「192個もCUDAを使う事が結構少ないから分けたら効率上がった」
って事だろうから、兎に角沢山計算したい場合、そういう効果も
無い。だから、core数微増+α位の性能アップなら古い方で大丈夫、
って事かも。場合によってはGTX-970を作り直してたら、手一杯、
なんて線、、、はないか?
2015/02/13(Fri) 15:09 | URL | 木津健介 #-[ 編集]
147183 
"ビデオカード"としては純粋に3Dパフォーマンスに
ふってくれた方が良いな ゲーマーに倍精度は盲腸・デッドウェイト

倍精度に魅力が無いのは赤いのやFermiが証明してる
2015/02/13(Fri) 15:49 | URL | LGA774 #-[ 編集]
147184 
ホントGPGPUはキラーアプリが出てこないね
そもそもCPUのマルチスレッド対応も完璧ではないアプリが多いままだし
2015/02/13(Fri) 16:30 | URL | LGA774 #-[ 編集]
147186 
そんなだからワットパフォーマンスとか言う割にGreen500でAMDがトップに立ってたりするんだろうな
TegraX1も単精度どころかFP16での性能を誇ってたりとかさ…
2015/02/13(Fri) 20:15 | URL | LGA774 #-[ 編集]
147188 
スパコン好きな私としては興味深いはなしですね。2017年ともなれば単体で15TFLOPS程度に到達するGPUも出てきそうですね。VoltaやPASCALがどのようなラインナップになるか楽しみです。
2015/02/13(Fri) 22:17 | URL | LGA774 #-[ 編集]
147189 
TitanはCUDA目当てに買ってた層も多いと思うんだがな
だいたいネーミングの由来はスパコンだったわけで
アップグレードパスとして倍精度が劣化ってのは…

予算について何も考えずに一番いいのを選べるとしても
最強のはずが旧世代機にボロクソに蹂躙されてるグラフを見たら
いっぺんに萎えそう
2015/02/14(Sat) 00:27 | URL | LGA774 #-[ 編集]
147190 
倍精度演算ユニットがないなんて・・・
終息に向かっているTITANもなくなってしまったら・・・
2015/02/14(Sat) 09:24 | URL | pp1-8 #-[ 編集]
147191 
動画のフィルター処理に倍精度使うだよな。
2015/02/14(Sat) 10:39 | URL | LGA774 #-[ 編集]
147192 
http://pc.watch.impress.co.jp/docs/column/kaigai/20101001_397079.html
5年前にMaxwellの名前が出た時は
倍精度演算器の比率がもっと高まると言ってたのに
5年経ったらこのありさまだよ
2015/02/14(Sat) 11:35 | URL | LGA774 #-[ 編集]
147195 
つまりHPCを捨ててグラフィックスに特化した事でMaxwellのワットパフォーマンスを実現した。
次世代Pascalは倍精度を入れてワットパフォーマンスは低下する、という事か
あまり喜べないな
2015/02/14(Sat) 18:52 | URL | LGA774 #-[ 編集]
147197 
ゲームや画像処理なら、むしろ半精度の方が使い易いみたいだしな。
2015/02/15(Sun) 01:30 | URL | LGA774 #-[ 編集]
147200 
画像処理なら単精度どころか半精度でもOKなら半精度性能追求の時代もくるかもね
2015/02/15(Sun) 18:55 | URL | LGA774 #-[ 編集]
147205 
>>今のところGPGPU市場じゃ敵なし
>どこの世界の話?

ビジネスの世界の話だな。
AMDとNVIDIAの決算見比べてみたら?
2015/02/15(Sun) 22:11 | URL | LGA774 #-[ 編集]
147208 
http://news.mynavi.jp/articles/2014/12/16/sc14_exascale/001.html
http://news.mynavi.jp/articles/2014/12/16/sc14_exascale/images/013l.jpg
右の図はアプリケーションの振舞いを調べたグラフで、それぞれ8色の棒グラフがあるが、
前述のDoEの6つのアプリケーションとTop500向きのLINPACKとGreen500向きのLINPACKに対応し、
各グループは左から順に、GPUのIPC、GPUのWarpの収束、GPUのメモリバンド幅の利用率、GPUのDP演算の利用率、
そして、CPUの利用率、ネットワークの使用率、Weak Scalingの効率を示している。

総じて言えるのは、LINPACKを除けば、CPUの利用率もGPUのDP演算の利用率も非常に低い点が目を惹く。
2015/02/16(Mon) 06:57 | URL | LGA774 #-[ 編集]
147209 
>147205
いや、直接の競合はXeon phiでしょ
14nmでAVX-512に対応したKnights Landingがすぐ背後に迫っている今
この分野で手抜きしてる余裕なんて本当に全く無いはずなんだが?
2015/02/16(Mon) 07:41 | URL | LGA774 #-[ 編集]
147211 
マイナビの記事の最初の方の2020年に7nmって話は、まず無理
なんじゃないかなぁ、、、
2015/02/16(Mon) 09:46 | URL | 木津健介 #-[ 編集]
147216 
Knights Cornerがスパコン応用方面的には残念性能だったし、
Knights Landingで性能向上したところで、まだ敵じゃないと
見込んでたりして…
2015/02/16(Mon) 18:13 | URL | LGA774 #-[ 編集]
147217 
>CPUの利用率もGPUのDP演算の利用率も非常に低い
そりゃあ、遅くなるからなるべく使わないように注意深くプログラムを作ってるのだもの。
数十年前は浮動小数点はものすごく高コストな処理だったのでみんな使わないようにしてた。
計算リソースがCPUからGPUになった現在でまた回帰をするのも面白いか。
2015/02/16(Mon) 18:44 | URL | LGA774 #-[ 編集]
147220 
GPGPUというか、機械学習で一大ブームになっているDeepLearingでは、CUDAの独壇場。
DeepLearningでは、FP32が基本で、大部分ではFP16でも大丈夫と言われている。TegraX1のFP16もそちら系の狙いと思われる。
TMSCがあの有様の状態で、メモリ節約、処理速度向上に繋がる、FP低ビット化は、英断だと思うね。
2015/02/17(Tue) 00:25 | URL | LGA774 #-[ 編集]
147232 
power vr等のモバイルはもとから16bit
センサー程度ならモノクロや8bitでも良い

(ディープラーニングで使ってる画像はモノクロ)

高精度な核実験のシミュレートとかじゃない限り倍精度は殆ど使わないんじゃない
2015/02/17(Tue) 13:06 | URL | LGA774 #-[ 編集]
147236 
>>147220
でもDeepLearningの需要だけでは市場が小さすぎる気がするがどうなんだろう
これまでGK110は大学のような汎用のスパコンにも使われていたことだから素粒子だの気象だの機械学習だの、とにかく何でもできることを要求されてきたわけでしょ
新コアは倍精度無理なんでやめちゃいましたとはできないと思う
あるいはスキップという可能性はまだ残ってるけど
2015/02/17(Tue) 19:07 | URL | LGA774 #-[ 編集]
147238 
>147232
金融計算に使われてますが?
2015/02/17(Tue) 22:08 | URL | LGA774 #-[ 編集]
147241 
半精度はそもそも演算は想定してなく、あくまでストレージ用途なんだけど
2015/02/18(Wed) 21:19 | URL | LGA774 #-[ 編集]
147244 
金融計算で倍精度ってどう使うの
2015/02/19(Thu) 10:23 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/7949-af271333
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック