北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
Exclusive details on AMD's Zen(Fudzilla)

Fudzillaで業界筋の情報よりAMDが2016年に予定している“Zen” CPUコアの詳細が少しずつ明らかになってきた。“Zen”では“Bulldozer”世代で行われていたコア間でのFPUの共有は廃止される。

上記のように述べていますが、大筋は今までの情報に沿ったもので、目立って新しい情報はありません。
 
まずFudzillaに掲載された16-coreの“Zen” CPUと“Greenland” GPUを組み合わせたAPUのブロックダイアグラムから見ていきます。

右側1/4の灰色の領域はI/Oが占めており、上からPCI-Express 3.0とSATA、72-bit×4chのDDR4メモリコントローラ、1つのGigabitEthernetが配置されています。左側3/4のうち上側の青い領域はPlatform processorとなっています。中央に配置されているのが“Greenland” GPUで下にHBM memoryが2チップ描かれており、この16-core APUでもHBMメモリが何らかの形で実装されるであろうことがわかります。そして左側にあるのが“Zen” CPUで合計で16-coreが描かれていますが、4-coreが1つのユニットを形成しています。それぞれの“Zen”コアは独立した512kBのL2キャッシュを有しており、4-coreごとに共有の8MBのL3キャッシュを有しています(このL3キャッシュが16-coreで共有できるものかどうかはまだわからない)。

文中ではFPUのコア間での共有が廃止されることが強調されていますが、既に“Zen”世代では“Bulldozer”のようなCrustered architectureはとらないことが明かされています。FPUの共有が取りやめになった背景として、14nmプロセスへの移行により、ダイに余裕ができたこと、そして共有しない方がより高性能化を見込めることが挙げられています。

Fudzillaでは“Zen”について明らかに“Haswell / Broadwell”と互換性のある命令セットアーキテクチャ (ISA) であると評しており、プログラムを変更することなく現行のソフトウェアを使用できるだろうと述べています(P6の正統進化を推し進めていったものが“Haswell / Broadwell”なら、“Zen”はK7→K8の正統進化を推し進めていったものになるのだろうか?)。またGCCなど様々なコンパイラへの最適化にも焦点が当てられているとしています。

“Zen”がどれほどのIPCを有しているのかはわからないものの、これによりIntel CPUとの差を縮められるのではないかと期待されます。



PCパーツの通販は・・・
ソフマップicon 1's TSUKUMO ネットショップ ドスパラ パソコン工房

コメント
この記事へのコメント
149471 
コンシューマ向けのZenにもHBM積んで欲しいが無理なんだろうな
2015/08/13(Thu) 20:25 | URL | LGA774 #-[ 編集]
149472 
メモコンが「72-bit×4ch」って一瞬なんだと思ったけど多分ECC付きなんだよね
2015/08/13(Thu) 22:36 | URL | LGA774 #-[ 編集]
149473 
きゅっ
>>右側1/4の灰色の領域はI/Oが閉めており、
→占めており、

AVXとか拡張してFPUって廃止にできないんですかね?
2015/08/13(Thu) 22:52 | URL | _ #-[ 編集]
149474 
この図の面積と実装面積って関係あるのかな
1GbEがあまりにも巨大すぎて違和感

こいつらを繋ぐバスがGMIとかCoherent Fabricとかいうやつらだろうか
2015/08/13(Thu) 22:56 | URL | LGA774 #-[ 編集]
149475 
Bulldozer否定から再生が始まる。。。
Zen、HDM2、新インターコネクト、エンタープライズ向けの巨大APU等々期待はしているよ。

まぁゲームやらないし7850kで困ることなんて正直ないけどね。
2015/08/13(Thu) 23:52 | URL | LGA774 #EGTCt1XI[ 編集]
149476 
FPUを拡張したのがAVXだろう
何を言ってるんだ
2015/08/14(Fri) 07:08 | URL | LGA774 #-[ 編集]
149477 
順当な置き方だ。特に奇をてらった部分も無い
直球勝負なのだろう。少しは期待していいかもしれない
2015/08/14(Fri) 14:12 | URL | LGA774 #-[ 編集]
149479 
ブルの呪縛からようやく脱出できる・・・のかな?
2015/08/14(Fri) 18:14 | URL | LGA774 #-[ 編集]
149481 
Bobcat/Jaguar系統はそれなりに素性の良いコアに仕上がったから
その路線で行けばうまく行きそうな気もするんだけどねぇ

クロックが頭打ちな現状、同じ消費電力でのIPC×コア(スレッド)数で上回れば面白いんだけど・・・
2015/08/15(Sat) 00:11 | URL | LGA774 #-[ 編集]
149482 
HBM2で16G位積んでくれたら、もうメモリも要らないよなぁ。
2015/08/15(Sat) 01:37 | URL | LGA774 #-[ 編集]
149483 
FPUについてはAMDがx64策定するとき何をトチ狂ったか命令セットに非推奨とはいえx87命令を残したのが間違い
2015/08/15(Sat) 02:11 | URL | LGA774 #-[ 編集]
149484 
あ〜自分がよく判ってなかったんですかね...

FPUって超越関数含むその名のとおりx87の数値演算コプロセッサって思っていました。
そんなん使わないから共有でいいよねという考え方かと。

http://int.main.jp/txt/bulldozer/
の情報では"sse の整数演算は、FPUで実行される"とあるのでSSE〜AVX2の拡張されたレジスタの事を指していたという理解で合ってますか?
2015/08/15(Sat) 04:07 | URL | 149473 #-[ 編集]
149485 
Crustered architectureは鯖とかエンコードには良かったんだけどなぁ
8C全部で同時にFPU使う処理ってごく一部の科学技術計算くらいしか思い浮かばない

もっとも、企業でハイエンドデスクトップを必要とするのはまさにそうした分野なので
そうしたカテゴリへのカムバックを睨んだCPUと邪推すると、ワクワクするね
2015/08/15(Sat) 07:52 | URL | LGA774 #-[ 編集]
149486 
>>149473
>AVXとか拡張してFPUって廃止に

VoltaくらいになればGPU単体でWindows起動できますかねってのと同じくらい無理。
2015/08/15(Sat) 08:00 | URL | LGA774 #-[ 編集]
149487 
>>149471
メリット無いですし
むしろ低クロックだからレイテンシで不利なんじゃ
2015/08/15(Sat) 08:40 | URL | LGA774 #-[ 編集]
149489 
ブルには散々期待を裏切られたからなあ
パッチ当てても性能延びなかったしほんと難産だった
zenには期待しないけどレビュー次第で一台組むかな
2015/08/15(Sat) 09:55 | URL | LGA774 #-[ 編集]
149490 
Bullの頃は設計自体自動化しすぎてCarrizoでも空き部分ができて困ってたな。Jimさんが本気出すと設計段階で最適化されてるんだろうな。
2015/08/15(Sat) 11:09 | URL | LGA774 #-[ 編集]
149491 
x87が残ってるのは32bitアプリとの完全な互換性のためでしょ

*149484
MMX含むSIMD命令はFPUの担当みたいよ。
2015/08/15(Sat) 12:14 | URL | LGA774 #-[ 編集]
149493 
X64はレジスタの拡張と命令追加しただけなんだからX87命令は当然残るだろ
完全な命令セットを新規に定義したとカンチガイしてるのかな?
2015/08/15(Sat) 13:53 | URL | LGA774 #-[ 編集]
149494 
自作PC界でもものすごく期待されている製品だと思う
もう一回intelが焦る姿を見たい
2015/08/15(Sat) 13:59 | URL | LGA774 #2DdjN05.[ 編集]
149496 
ブルドーザーに裏切られたと言う人達はCPU性能を
ベンチマークでしか考えられないんかね?というか未だに
そういうジサカーが山ほどいるからFXの並列処理の
強さが知られない、注目されないんだろうな・・・・・・
2015/08/15(Sat) 15:08 | URL | LGA774 #-[ 編集]
149497 
64bitでは浮動小数点はSSE/SSE2の利用を推奨していたと思う。
2015/08/15(Sat) 18:52 | URL | LGA774 #9zOzYU0I[ 編集]
149498 
4コアで1組を構成するのはJaguarに似ている
L2が減ってL3キャッシュを搭載するなど違いはあるけども
別にBulldozerを否定する気はないが14nmならAPUのJaguar16コアでも性能悪くなりようにないと思うな
x264の性能は単純にjaguar2GHzに4をかけ算してもFX8コアを上回って4770k相当になるし
トランジスタ増やせるのは正義だ
2015/08/15(Sat) 21:02 | URL | LGA774 #-[ 編集]
149499 
>AVXとか拡張してFPUって廃止にできないんですかね?

x87が入っていないのにFPU命令を実行するとFPU例外があがる。Windowsがそれを適切にハンドリングできれば良い。

そうなったとき意外と困るのはMSのコンパイラとかが自動ベクトル化できないのでintrinsicを使っていちいち書かなければならないので面倒。

盲腸で付けておくのが無難かと。
2015/08/15(Sat) 21:03 | URL | LGA774 #-[ 編集]
149501 
Bullもだんだん良くはなってるから、コンセプトの問題よりは設計自動化による不都合と遅れに遅れたのが大きかったんじゃ…
TrinityアーキテクチャのFXはSandy i5には対抗出来たしなあ。FX 8150もi7 920には対抗出来るみたいだし。

あと、マーケティングの都合で1モジュール2コアとしたのもダメだったかも。1モジュール1コアならライセンスも安かった。
2015/08/16(Sun) 18:00 | URL | LGA774 #-[ 編集]
149503 
>>149487
基板を這わせてch間で同期をとる必要があるDDR4よりは、さすがに動作周波数を上げやすい気がするな。

ただ、スパコンのようにソフトウェアを個々のハードウェアに最適化するなら別だが、すでに販売されているような既存のソフトウェアはほとんど高速化できないと思う。
これはBulldozerで失敗した手法なので、同じ轍は踏まないだろう。
2015/08/16(Sun) 19:29 | URL | LGA774 #-[ 編集]
149504 
問題になるのは性能ではなく、いつ出て来るかだ
買う事自体は既に決まっているのだから
2015/08/16(Sun) 22:50 | URL | LGA774 #-[ 編集]
149505 
Bullの設計は自動化がダメだったんじゃないぞ
最後に人力で最適化をしなかったことで、電力や性能を改善できなかった
最新の自動化ツールでも、最適化の度合いは半分も行かない
人力でチェックやボトルネック潰しをする手間が絶対に必要
Bullはコストや時間の制限でソレを削ったから、問題点だらけでのリリースになった
2015/08/16(Sun) 23:42 | URL | LGA774 #-[ 編集]
149507 
まぁ、製造技術が停滞していたから仕方ない選択だったから・・・。

インテルがプレスコとか失敗した時は既存の設備と新規設備で振り分けを変えられたけど、
他社はそんな余裕何処にもないから総倒れ・・・。


さて、E4までは甲突破・・・。
既に乙へ逃げたくなったよorz。
瑞穂は掘れるのだろうか?
2015/08/17(Mon) 09:13 | URL | i7 市民 #-[ 編集]
149508 
16コア+APUってかなりダイが大きくなりそうだけど14nmmプロセスだとそんなに無茶な事ではないのかな
2015/08/17(Mon) 19:19 | URL | LGA774 #-[ 編集]
149515 
>149496
普通に使ってる人たちが気がつかないのであれば、それはメリットに成り得ないということだと思う…残念だけど。
これはPC全体の話でもあるけど。
2015/08/18(Tue) 01:05 | URL | LGA774 #-[ 編集]
149518 
x87は80bit浮動小数演算なので、64bitのSSE2+/AVXの倍精度浮動小数と別に必要になることが今でもまれによくある(TM)。Super piなんかもx87で出来ているので、メーカーとしては投げ捨てるわけにも行かない。(まぁあれは80bitにする必要がないアプリなんだけど)

x87に対応すると80bit浮動小数用の加乗算器を乗っける必要があるけど、これは実は64bitの整数加算・乗算器があれば実装できる。そして64bitの加算・乗算器は整数AVX命令のためにすでに実装されている。ということで、余分な面積はあまり取っていないので、落としたところで利点が殆ど無い。
2015/08/18(Tue) 02:19 | URL | LGA774 #-[ 編集]
149521 
>>149515
>普通に使ってる人たちが気がつかない
PenGとCore i7 EEでもそのまま当てはまる話だが、そこはやはりブランドだろうなあ。

メニーコアのスループット志向ってのがそもそもフルパワーを前提とした話なので
ずっとアイドリング、一瞬ピークのようなデスクトップPCでは何かと辻褄が合ってない。
2015/08/18(Tue) 07:50 | URL | LGA774 #-[ 編集]
149534 
>MMX含むSIMD命令はFPUの担当みたいよ。

だよね。
x87のレジスタを流用して、レジスタ間の8-32bit整数と32bit浮動小数点演算を並列化したのがMMXだから。

その後、
SSEでSIMD専用レジスタを用意し、SSE2でSIMDレジスタでの整数並列演算を可能とし、
SSE3~4でレジスタ内部での並列演算を可能にした

ってところか。
2015/08/18(Tue) 13:07 | URL | LGA774 #-[ 編集]
149560 
AMD自身がブルドーザーが失敗アーキテクチャだと認めて捨て去ったのに
ベンチマークがどうとかなに言ってんだろう
2015/08/20(Thu) 00:35 | URL | LGA774 #-[ 編集]
149563 
商業的な失敗と技術的なマイルストーンは別物な
2015/08/20(Thu) 06:17 | URL | LGA774 #-[ 編集]
149576 
初代はダメだけど、Piledriver移行の扱いはそうでもないような。
どっちにしても設計以前にプロセスで負けてたからなあ…
2015/08/20(Thu) 23:43 | URL | LGA774 #-[ 編集]
149577 
技術的に失敗だったから共有はやめたんだが?
ZENでブルの特徴を全く引き継がずに
Intelに倣ってSMTを採用してるしな
2015/08/21(Fri) 00:29 | URL | LGA774 #-[ 編集]
149587 
>AVXとか拡張してFPUって廃止にできないんですかね?

今のコンパイラはFPUを使ったコードは吐かないから、後方互換を考えなければ廃止にできるよ。
2015/08/21(Fri) 08:16 | URL | LGA774 #-[ 編集]
149610 
>149534
MMXに浮動小数点演算はないよ
SSEで単精度×4ができ、SSE2で倍精度×2ができるようになった
2015/08/22(Sat) 03:03 | URL | LGA774 #-[ 編集]
149642 
>>149496
"Bulldozer"系を使って思うことは「トップスピードも大事」って事ですわよ。
2015/08/23(Sun) 11:30 | URL | LGA774 #-[ 編集]
149681 
>149496
正直コスパ優先だったけど、期待以上だった。仮想マシンやコンパイル、エンコード等の裏作業がサクサクなのは良いね。
すっかりAMDのファンになったので
Zenは楽しみだけど、今で正直何の不満もないんだよな・・
2015/08/24(Mon) 23:56 | URL | LGA774 #etbfE.eg[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/8225-885c60a2
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック