北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
AMD Hawaii (R9 290 series) GPU diagram leaks out(VideoCardz)
AMD "Hawaii" Architecture Diagram Leaked(techpowerUp!)

Radeon R9 290Xに関するプレゼンテーション資料がリークした。ただし、このダイアグラムに関する説明を記載したホワイトペーパーは入手できていないので、十分な詳細を語るのは難しい。だがしかし、“Hawaii”が全く異なるGPUであることはわかる。

公式に明らかにされているのは“Hawaii”のダイサイズが438mm2であることだ。そして前世代からいくつかの注目すべき変更がある。まず“Hawaii”は44基のCompute unitを有しており、それが4つのShader Engineに分かれている。Geometry EngineやRasterizerはShader Engineの中に移動している。そして“Hawaii”は8基の64-bitメモリコントローラを有し(“Tahiti”は6基)、合計で512-bitのBusを実現している。ACEも8基に増加している(“Tahiti”は6基)。
 
CrossFire CompositorはCrossFire XDMAに置き換えられた。またVCEとUVD multimedia acceleratorの間には新たにTrueAudio DSPが設けられている。

Radeon R9 290XはRadeon HD 7970 GHz Editionからジオメトリの処理能力を90%程向上させる。数字を挙げるとRadeon HD 7970 GHz Editionが210万 triangles/sであったのに対し、Radeon R9 290Xは400万triangles/sとなっている。単精度浮動小数点演算性能も30%向上しており、5.6TFlopsとなる(Radeon HD 7970 GHz Editionは4.3TFlops)。またTexture mapping unitとRaster Operating unitを増加したお陰で、Texture fill rateは30%、Pixel fill rateは90%向上し、それぞれ176Gteexels/sと64Gpixels/sとなっている(“Tahiti”がはそれぞれ134.4Gtexels/sと33.6Gpixels/s)。またスライドによるとダイ面積あたりの演算性能も5%向上しているという。

まとめると“Hawaii”は合計で2816基のStreamProcessorを搭載し、44×4で合計176のTMUを搭載、ROPは64基でメモリインターフェースは512-bitとなる。

“Hawaii”のブロックダイアグラム(2013年10月14日)

VideoCardzには複数枚のプレゼンテーションスライドが掲載されており、興味深い内容が記載されています。

4枚目はGCN architecture Compute unitと題されており、Compute unitの構造が描かれています。
5枚目はRender Back Endsというタイトルで、合計で16基までが搭載され(1基にZ/Stencil ROPとColor ROPが4基ずつ搭載される)るとあります。またL2キャッシュを1MB搭載し、L2/L1の帯域が最高1TB/sであると記されています。
6枚目はMemory interfaceと題され、“Hawaii”のメモリインターフェースがより面積効率の良いものであることが強調されています。具体的には“Hawaii”の512-bitメモリインターフェースは“Tahiti”の384-bitメモリインターフェースと比較し、専有面積を20%減じているとあります。ダイ面積あたりの帯域では50%増加しているとされています。
7枚目はAsynchronous computeと題され、ACEの構造が描かれています。

いずれもかなり詳しい内容のスライドで、非常に興味深いものとなっています。



PCパーツの通販は・・・
ソフマップicon 1's TSUKUMO ネットショップ ドスパラ パソコン工房

コメント
この記事へのコメント
140436 
一部の数字がおかしいみたいですね。

210万 triangles/clockや400万triangles/clockというのは性能が高すぎます。

確認したところ、元の記事では2.1G Triangle/s、4G Triangle/s でした。
おおむね1クロックで4頂点を処理できるようになったようです。

面積あたりの演算性能は、単純にダイの中でのシェーダの割合が増えただけなのか、シェーダユニットの改良や最適化があったかの判断が難しいですね。
2013/10/14(Mon) 02:21 | URL | LGA774 #-[ 編集]
140439 
ジオメトリ処理能力90%程向上Σ
欲しいが金が無い
2013/10/14(Mon) 09:15 | URL |   #-[ 編集]
140440 
Tahitiは16×2だったが、Hawaiiは11×4ってことで、ジオメトリが2から4の約2倍
というか、Tahitiと比べてというより、その前のCaymanと比べて2倍と言った方が分かりやすいだろう
2013/10/14(Mon) 10:59 | URL | LGA774 #-[ 編集]
140441 
何故これを280Xに採用しなかった…
2013/10/14(Mon) 11:53 | URL | LGA774 #-[ 編集]
140442 
※140441

20nmの方でやるつもりなんでしょうね 
2013/10/14(Mon) 15:28 | URL | LGA774 #-[ 編集]
140443 
ジオメトリ性能が90%も上がってるとかすごすぎるな・・・
2013/10/14(Mon) 16:52 | URL | LGA774 #-[ 編集]
140444 
>140441
製品全部がこけたらヤバいからハイエンドだけ移行パターンなんでしょ。VLIW5→VLIW4みたいに
2013/10/14(Mon) 21:13 | URL | LGA774 #-[ 編集]
140457 
なんだかんだで10日以内に発表されるんだからwktkして待ってればいいさ。
2013/10/15(Tue) 17:27 | URL | i7 市民 #-[ 編集]
140485 
お試しとして次世代のミドルを現ハイエンドとして出してるだけ

28nmで440mm2なら、20nmで300mm2強になるから、今回の目玉と次世代の売れ筋を1回で試せる
後は単純シュリンクするだけ
流石にバス幅は256か384bitになるけど
2013/10/16(Wed) 23:36 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/7143-bb652e6a
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック