北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
Haswell’s GPU prowess is due to Crystalwell(SemiAccurate)
Rumor: Some Haswell CPUs to have 64MB onboard memory(The Tech Report)

“Haswell”ではGPUの性能が劇的に向上すると述べたのを覚えているだろうか(SemiAccurateでは数ヶ月前に“Haswell”のGPUのうち最上位のGT3はEU数が40となると述べている)。“Haswell”ではEU数も増えるが性能向上の要因はそれだけではない。“Haswell”では“Crystalwell”と呼ばれる技術が使われるのである。
 
“Crystalwell”は一部で推測されているようにL4キャッシュを単純にパッケージ内に封入するというものではなく、Silicon interporserを用いてGPUメモリを搭載する。“Haswell”のGT3では64MBのオン・パッケージのメモリがUltra-wide bus(≒超広帯域のバス)で接続される。この帯域は広いものであり、これによりShader performanceは5倍に向上するとも言われる。実際メモリ帯域がShader performanceに与える影響は大きい。

“Haswell”では“SandyBridge / IvyBridge”からピン数が減少するが、ピンが減る場合としてはメモリチャネルが減少する、I/O周りの電力が減少するなどがあり、ピンの減少によりパッケージングコストも抑えられる。Silicon interporserの実装はコストがかかるが、オンダイのフレームバッファとして十分なものであれば、CPUが低いC-stateにはいっているときの消費電力を減少させることが出来、発熱も抑えられる。

“Haswell”のGPUは下からGT1, GT2, GT3があります。一般のデスクトップ向けとメインストリームMobile向けには4-core+GT2までが提供されるといわれていますが、4-core+GT3の存在が最近いわれ始めています。この4-core+GT3ではL4キャッシュが搭載されるという噂が立っていますが、今回のSemiAccurateでは“Crystalwell”と呼ばれる技術がGT3で使われ、これはGPUメモリとして使われるオン・パッケージのメモリであるとしています。このオン・パッケージのメモリの帯域は非常に広いものとなるようで、これらを搭載することによりShader performanceは劇的に向上すると述べています。

Silicon interporserを介してメモリをパッケージングするという話はSemiAccurateが“IvyBridge”でこれが行われるのではないかという話がありましたが、それ以降音沙汰なしです。Silicon interporserは基板とシリコンダイの間に介在(Interpose)するもので、Silicon interporserに上にダイとメモリが載る形となるようです。

(参考:Silicon interporserに関する記事)
Intel puts GPU memory on Ivy Bridge(SemiAccurate)
Xilinx、28nmプロセス世代のStacked Interconnectを説明(マイナビニュース)

(追記・訂正2012年4月3日20時22分)
コメントNo.115724様よりご指摘を頂き、内容を修正致しました。
情報提供いただきありがとうございました。

(過去の関連エントリー)
“Haswell”はCPUとGPUで共有するL4キャッシュを有する・・・らしい(2012年3月20日)


関連記事



○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源