北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced(AnandTech)
NVIDIA Announces Its Volta-based Tesla V100(techPowerUp!)
NVIDIA GV100 Silicon Detailed(techPowerUp!)
NVIDIA、Voltaアーキテクチャ採用5,120 CUDAコア/210億トランジスタの新GPU「Tesla V100」(Impress PC Watch)
本格的に深層学習へ舵を切った真のジャイアントコア「Tesla V100」(Impress PC Watch / 後藤弘茂のWeekly海外ニュース)
[GTC 2017]NVIDIA,Volta世代の数値演算アクセラレータ「Tesla V100」を発表。815平方mmのダイサイズに5120基のCUDA Coreを集積(4Gamer.net)
[GTC 2017]西川善司の3DGE:Volta世代のGPU「GV100」は,これまでと大きく異なるプロセッサだ――いったい何が?(4Gamer.net)

NVIDIAは5月10日、GTC 2017で新世代のGPUアーキテクチャとなる“Volta”をベースとしたTesla V100を正式発表した。

Tesla V100にはGV100と呼ばれるGPUコアが採用されており、製造プロセスはTSMC 12nmプロセス、ダイサイズは815mm2、トランジスタ数は210億となる。CUDA core数は5120である。メモリにはHBM 2を採用し、900GB/sの帯域を有する。またNVLinkは第2世代となる300GB/sの帯域を有する。
 
GTX 2017で“Volta”世代としては最初のコアとなるGV100を使用したTesla V100が正式発表されました。Tesla V100は先代のTesla P100の後継で、数値演算アクセラレータと位置づけられます。

Tesla
V100P100M40K40
コア・プロセスGV100 12nmGP100 16nmGM200 28nmGK110 28nm
ダイサイズ815mm2610mm2601mm2551mm2
トランジスタ数211億153億80億71億
SM80562415
CUDA core数5120358430722880
CUDA core/SM6464128192
コア
周波数
Base****MHz1328MHz948MHz745MHz
Boost1455MHz1480MHz1114MHz875MHz
演算性能FP1630TFlops21.2TFlops6.8TFlops4.29TFlops
FP3215TFlops10.6TFlops6.8TFlops4.29TFlops
FP647.5TFlops5.3TFlops213GFlops1.43TFLops
搭載メモリHBM2 16GBHBM2 16GBGDDR5 12GBGDDR5 12GB
メモリ帯域900GB/sec720GB/sec288GB/sec288GB/sec
メモリインターフェース4096-bit4096-bit384-bit384-bit
L2 cache6MB4MB3MB1.5MB
TDP300W300W250W235W


Tesla V100と過去3世代のTesla製品のスペックを並べたものが上記となります。Streamint Multiprocessor(SM)は80で、FP32ユニットはSMあたり64、FP64ユニットはSMあたり32となります。SM辺りの演算ユニットの数だけ見ると前世代のGP100と同様ですが、その中身は前世代から一新されています。GV100で追加されたものの1つとしてSMあたり8ユニットのTensor Coreなる演算アレイがあります。これは機械学習向け演算アレイと位置づけられ、4×4のマトリックス同士の演算をサポートする、と解説されています。

詳しいアーキテクチャの内容は日本語の解説記事が既に出ていますので、そちらをご参照ください。

ただ、日本語記事であまり振れられていない点の1つのしてGV100そのもののスペックがあります。CUDA core総数5120・SM数80というのはあくまでもTesla V100のスペックとなります。GV100そのものは84基のStreamMultiprocessorを搭載しており、CUDA coreの総数は5374となるようです。前世代のGP100もフルスペックであればCUDA core 3840/SM 60となりますが、Tesla P100ではSM 4基分を無効化したCUDA core 3584/SM 56というスペックとなっています。これと同様の事がTesla V100でも行われており、歩留まりの向上に役立てています。

このTesla V100はディープラーニング、機械学習に力を入れた製品である、というのは日本語記事の解説が詳しいでしょう(乙女回路やちょびっツを実現するのはひょっとするとNVIDIAかも?)



PCパーツの通販は・・・
ソフマップicon 1's TSUKUMO ネットショップ ドスパラ パソコン工房

コメント
この記事へのコメント
156132 
V102かな、次期TAITAN Xは?
秋口には円高になっているといいな
2017/05/13(Sat) 07:29 | URL | ななしです #W3ugQoag[ 編集]
156136 
表にFP32が2つありますが、上側はFP16でしょうか?
2017/05/13(Sat) 12:49 | URL | LGA774 #SFo5/nok[ 編集]
156139 
skynetに自我が芽生えちゃう
2017/05/13(Sat) 17:33 | URL | LGA774 #-[ 編集]
156140 
Voltaが年内だというので、Teslaが年末、
半年後にTitanだと思ってたけど、ずいぶん早かったね。
Vega買おうと思ってたんだけど悩ましいな。
2017/05/13(Sat) 19:08 | URL | LGA774 #-[ 編集]
156200 
一般向けのVoltaが発売される頃にはNAVIの足音も聞こえてくるし
2017/05/18(Thu) 11:46 | URL | LGA774 #-[ 編集]
156300 
乙女回路なんて分かる人はもういませんよw
2017/05/29(Mon) 02:49 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/8930-1dedcb85
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック