Haswell’s GPU prowess is due to Crystalwell(SemiAccurate)
Rumor: Some Haswell CPUs to have 64MB onboard memory(The Tech Report)
“Haswell”ではGPUの性能が劇的に向上すると述べたのを覚えているだろうか(SemiAccurateでは数ヶ月前に“Haswell”のGPUのうち最上位のGT3はEU数が40となると述べている)。“Haswell”ではEU数も増えるが性能向上の要因はそれだけではない。“Haswell”では“Crystalwell”と呼ばれる技術が使われるのである。
Rumor: Some Haswell CPUs to have 64MB onboard memory(The Tech Report)
“Haswell”ではGPUの性能が劇的に向上すると述べたのを覚えているだろうか(SemiAccurateでは数ヶ月前に“Haswell”のGPUのうち最上位のGT3はEU数が40となると述べている)。“Haswell”ではEU数も増えるが性能向上の要因はそれだけではない。“Haswell”では“Crystalwell”と呼ばれる技術が使われるのである。
“Crystalwell”は一部で推測されているようにL4キャッシュを単純にパッケージ内に封入するというものではなく、Silicon interporserを用いてGPUメモリを搭載する。“Haswell”のGT3では64MBのオン・パッケージのメモリがUltra-wide bus(≒超広帯域のバス)で接続される。この帯域は広いものであり、これによりShader performanceは5倍に向上するとも言われる。実際メモリ帯域がShader performanceに与える影響は大きい。
“Haswell”では“SandyBridge / IvyBridge”からピン数が減少するが、ピンが減る場合としてはメモリチャネルが減少する、I/O周りの電力が減少するなどがあり、ピンの減少によりパッケージングコストも抑えられる。Silicon interporserの実装はコストがかかるが、オンダイのフレームバッファとして十分なものであれば、CPUが低いC-stateにはいっているときの消費電力を減少させることが出来、発熱も抑えられる。
“Haswell”のGPUは下からGT1, GT2, GT3があります。一般のデスクトップ向けとメインストリームMobile向けには4-core+GT2までが提供されるといわれていますが、4-core+GT3の存在が最近いわれ始めています。この4-core+GT3ではL4キャッシュが搭載されるという噂が立っていますが、今回のSemiAccurateでは“Crystalwell”と呼ばれる技術がGT3で使われ、これはGPUメモリとして使われるオン・パッケージのメモリであるとしています。このオン・パッケージのメモリの帯域は非常に広いものとなるようで、これらを搭載することによりShader performanceは劇的に向上すると述べています。
Silicon interporserを介してメモリをパッケージングするという話はSemiAccurateが“IvyBridge”でこれが行われるのではないかという話がありましたが、それ以降音沙汰なしです。Silicon interporserは基板とシリコンダイの間に介在(Interpose)するもので、Silicon interporserに上にダイとメモリが載る形となるようです。
(参考:Silicon interporserに関する記事)
Intel puts GPU memory on Ivy Bridge(SemiAccurate)
Xilinx、28nmプロセス世代のStacked Interconnectを説明(マイナビニュース)
(追記・訂正2012年4月3日20時22分)
コメントNo.115724様よりご指摘を頂き、内容を修正致しました。
情報提供いただきありがとうございました。
(過去の関連エントリー)
“Haswell”はCPUとGPUで共有するL4キャッシュを有する・・・らしい(2012年3月20日)
- 関連記事
-
- 2014年の“Haswell-EX”でDDR4への移行が始まる (2012/04/06)
- “Haswell”のGPUに関わる“Crystalwell”と呼ばれる技術とは (2012/04/03)
- TDP35WのPentium G860TとG640Tが第2四半期に予定されている (2012/04/03)
○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源