北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
Nvidia Pascal GP100 GPU Flagship Will Pack A 4096-bit Memory Bus And Four 8-Hi HBM2 Stacks(WCCF Tech)

“Pascal”世代のGPU出“big Pascal”とも呼ばれるGP100は4096-bitのバスを有し、4つのHBM 2 stackを搭載する。そして搭載されるHBM 2は最大で8-Hiのものになるという。“Pascal”はTSMC 16nm FinFETプロセスで来年後半に登場予定である。WCCF Techで得た情報では、このGP100は2種類のHBM 2ソリューションを用いるようであるが、どちらもメモリインターフェースは現在HBM 1搭載GPUとして投入されている“Fiji”と同様の4096-bitとなる。
 
まず最初のものはやはり4つのHBM 2 stackを搭載するが、これあ4-Hiのもので、周波数は1GHzである。このタイプは一般的なGP100搭載GeForceとして投入されることになる。2番目のものは4基のHBM 2を搭載して周波数が1GHzになることは同じであるが、8-Hiのものが使われるのが相違点である。

HBMにおいて4-Hiや8-Hiは積層されるDRAMダイの数を表している。そしてメモリの積層を増やしたからといって、追加でメモリのPHYや介在させるためのロジックなどのベースのダイが追加で必要になることはない。この積層の数は純粋にDRAMのダイを表しており、PHYやロジックなども含めた合計の積層数を表しているのではない。8-Hi HBM 2を搭載したGP100はProfessional製品に限定され、QuadroやTeslaとして登場する。これらの製品では大容量のメモリが求められるからである。

NVIDIAの“Pascal”世代のフラッグシップとなるGP100は既にTSM 16nmFinFETプロセスで先月のうちにテープアウトを迎えたと言われている。興味深いところに、AMDも3日前に2種類のFinFET製品を第2四半期のうちにテープアウトさせたことを明らかにしている。両者とも積極的にFinFETプロセスをベースとした次世代GPUを2016年に投入しようとしていることが分かる。

TSMC 16nmFinFETプロセスは28nmプロセスと比較し劇的に電力効率が向上することが約束されている。またトランジスタの密度が28nmプロセス比で増加することも重要である。そのため、NVIDIAはより高速で、より複雑で、より電力効率に優れたGPUを製造することができる。

16nm FinFET Plus (16nmFF+) プロセス技術は28nmプロセスと比較して65%高速化し、密度は2倍に、そして消費電力は70%削減される。20SoCプロセスとの比較では、40%の高速化と60%の点力抑制が可能である。20SoCプロセスでの経験の積み重ねを元に、16nm FF+で20SoCと同じメタルバックエンドプロセスを用いことで、イールドを早く立ち上げ、市場に投入される頃にはプロセスを成熟させることができる。

HBM 2や16nm FinFETプロセスをは別に、“Pascal”にはcompute-centericな大きな機能がある。それはNVLinkであり、“Pascal”はこのサーバー向けに開発された独自の機能を最初にサポートするGPUとなる。

NVLinkはチップ間接続の帯域が多大な制限となっているシステムにおいて、GPUを強化するためのものである。NVIDIAはNV-Linkを通常のPCI-Express 3.0よりも5~12倍高速であると述べている。今年初めにはこのNVLinkについてIBMは将来のサーバー向けCPUでこのNV-Linkを実装すると発表している。

NVIDIA NVLinkは広帯域で電力効率に優れた内部接続である。NVLinkによりCPUとGPUあるいはGPU同士の高速な通信を実現する。NVLinkは通常のPCI-Express 3.0接続と比較し5~16倍高速なData Sharingを可能とし、アプリケーション性能を劇的に高速化できるだろう。そしてAccelerated computing向けの新しい高密度・フレキシブルサーバーを創り出すことができる。

“Maxwell”とは異なり、NVIDIAは“Pascal”でGPGPUアクセラレーションや一般演算に重きを置いている。新たな技術もNVIDIAが“Pascal”をエンタープライズ向けに焦点を当てて開発していることを示している。次世代のHigh-bandwidth memoryやNVLink GPU inteconncet、Mixed precisionのサポートはMobileアプリケーションを高速化し、Mobileの電力効率を向上させる(Mobile機器に搭載されると言うよりは、サーバー側でのアプリケーション実行速度を上げて、Mobileに関与するシステム全体の電力効率を上げられるという意味だろうか)。“Pascal”の登場は2016年である。

後半はNVLinkなどの話となっていますが、主題は前半で“Pascal”の大型チップであるGP100が8-Hi HBM 2を搭載するという話です。同じGP100でもGeForce向けの4-Hi HBM 2搭載のものと、QuadroやTeslaなどのProfessional製品向けの8-Hi HBM 2搭載のものがあるようです。ひょっとすると後者がGeForce GTX Titan seriesとして出てくる可能性はありますが、自作PCには基本的に前者が使われることになるでしょう(GeForce GTX 1090 Ti? あるいは次世代GTX Titanもこのタイプで、8-Hi HBM 2搭載はGeForceには全く下りてこない?)。まだ具体的な話は何も出てきてはいない様なので、実際の製品がどうなるかはこれから楽しみに待つとしましょう(GP100の下にあるであろうGP104はGDDR5だろうかHBMだろうか、という点も今後興味がわく話題であろう)。



PCパーツの通販は・・・
ソフマップicon 1's TSUKUMO ネットショップ ドスパラ パソコン工房

コメント
この記事へのコメント
149121 
GP100が二種類あるということは、GeForceのハイエンド (x80)も今回はGP104ではなくGP100になるということなのだろうか。出来ればx70もGP100でGTX970の汚名をそそいで欲しいものだが…
順当に行けばGeForce 1000シリーズだが、4桁突入ということで命名規則の刷新もありえるな

NVLinkはM/Bが対応してくれないと使いようがないので一般に普及するかどうかは未知数だ
よほどPCIeからパフォーマンス向上が望めないと消費者はM/B買い換えてまでNVLinkで繋ごうとは思わないわけで
2015/07/23(Thu) 17:13 | URL | LGA774 #-[ 編集]
149122 
とすると、AMDもNVIDIAもHBM2はほとんど同時期かな。
NVLinkって物理的にはどう実装されるんだろう?
2015/07/23(Thu) 19:02 | URL | LGA774 #-[ 編集]
149124 
今のAMDの奴がHBM1が4Hiで1個2Gbit×4で、それを4つ乗っけてるから512GB/sec。
記事の1GHzが実クロックならHBMの倍、HBM2は8Gbitが出るようなので、
4Hiは8Gbit×4×4で16GB、
8Hiは8Gbit×8×4で32GBの計算に。
(たぶん、帯域は両方とも1TB/sec)

4Gbit、4Hiチップで半分だけ使ったとしても、
4Gbit×4×2で4GB搭載で512GB/sか…
HBMなら960の悲劇は起きないな…
2015/07/23(Thu) 20:08 | URL | LGA774 #-[ 編集]
149125 
来年後半?
2015/07/23(Thu) 20:42 | URL | LGA774 #-[ 編集]
149126 
太いぜ。
2015/07/23(Thu) 22:01 | URL | LGA774 #-[ 編集]
149131 
>149122
多分パスカルのほうが数ヶ月遅れるだろう

HBM2の最初はhynixだけで製造量も少なくてAMDに先行供給されるし、インターポーザもUMCとAMDが長年共同開発してきているから14nmと同時に投入できる

逆にNvidiaにはメモリチップもインターポーザも供給元が決まってないのか不明だし、面倒で歩留まり低そうなインターポーザへの実装も、初の実装なNvidiaは手こずりそう
2015/07/24(Fri) 00:28 | URL | LGA774 #-[ 編集]
149133 
まだまだ先だな。やっぱハイエンドだけですかね。
2015/07/24(Fri) 02:27 | URL | LGA774 #-[ 編集]
149135 
HBMがだんだんミサイルに見えてくる
2015/07/24(Fri) 08:25 | URL |   #-[ 編集]
149136 
NVLINKはGPU同士の接続にも使用されますが、従来のPCIEブリッジ接続のマルチGPUカードに比べて速くなったりするだろうか。複数GPUのGPCを束ねて1GPUとして処理するようなことができると面白いのですが。
2015/07/24(Fri) 09:35 | URL | LGA774 #-[ 編集]
149138 
NVLinkはGeForceにはほとんど関係ないと言ってもいいのかな
PCIe2.0 x16やPCIe3.0 x8でもゲームのパフォーマンスには1%前後しか影響しないようだし
それともSLIの効率が上がって、ほぼ枚数通りのパフォーマンスを発揮できるとか?
2015/07/24(Fri) 14:39 | URL | LGA774 #-[ 編集]
149141 
ゲームユーザー向けにはmaxwell継続するんじゃね
2015/07/24(Fri) 18:01 | URL | LGA774 #-[ 編集]
149142 
>>149131
先行供給と言っても製品の出荷はGPUコア次第では

次世代プロセス製品のテープアウトではNVIDIAのほうが1ヶ月近く先行してる
HBMの供給量が不足する見通しならばハイエンドだけの採用になるだろうし
どちらかと言えばAMDもNVIDIAもHBMよりGPUダイの歩留りのほうが足を引っ張る気がする
2015/07/24(Fri) 19:12 | URL | LGA774 #-[ 編集]
149144 
nvlinkなんてPower8専用。
まずはDMIやPCI-Eの帯域を使い果たしてからだ
2015/07/24(Fri) 20:21 | URL | LGA774 #-[ 編集]
149150 
テープアウトの発表が先行しただけで実際の時期は不明だけどね
AMDは設計段階からHBM2やインターポーザを含めた完成品を想定したシミュレーション等の出来るけど、NvidiaはHBM関係の詳細なデータは持ってないだろうから、それを待つためワンテンポ開発に遅れが出てくると思う
2015/07/25(Sat) 11:20 | URL | LGA774 #-[ 編集]
149181 
4096bit…すごいね
こういうの見る度にFPGAに積んでくれないかなぁと思ってしまう.
帯域不足も改善するし基板設計も等長配線で悩まなくていいしでメリットも多い.
とはいえこれだけIOがあるとチップサイズもある程度の大きさが必要だな.価格上昇さえ抑えられれば積む価値あるんだがなぁ.
2015/07/26(Sun) 19:27 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/8184-03c8ee09
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック