NVIDIA GTX 350 ES version is ready and the specs revealed?!(HARDSPELL.COM)
GT300を使用するGeForce GTX 350なるカードのスペックが記載されています。
・・・といっても元記事ですら「不確か」としていますから、怪しい噂話程度と認識しておくのがいいでしょう。
◇GeForce GTX 350
・コア:GT300
・製造プロセス:55nm
・ダイサイズ:576mm2
・メモリインターフェース:512-bit
・搭載メモリ:GDDR5 2GB
・Stream Processor数:480
・コア周波数:830MHz
・Shader周波数:2075MHz
・メモリ周波数:3360MHz
・DirectX 10 / Shader Model 4.0対応
GT300を使用するGeForce GTX 350なるカードのスペックが記載されています。
・・・といっても元記事ですら「不確か」としていますから、怪しい噂話程度と認識しておくのがいいでしょう。
◇GeForce GTX 350
・コア:GT300
・製造プロセス:55nm
・ダイサイズ:576mm2
・メモリインターフェース:512-bit
・搭載メモリ:GDDR5 2GB
・Stream Processor数:480
・コア周波数:830MHz
・Shader周波数:2075MHz
・メモリ周波数:3360MHz
・DirectX 10 / Shader Model 4.0対応
この記事へのコメント
いくらnVIDIAでもGDDR5で512bitは無理じゃないかなぁ…
無駄な拡張してもダイの肥大化要因にしかならないと思う…
無駄な拡張してもダイの肥大化要因にしかならないと思う…
2008/07/19(土) 01:34 | URL | BLACK #-[ 編集]
>GDDR5で512bit
なんのためにGDDR5にするのか分からんしな
こんなことすると
もう配線が限界じゃ
なんのためにGDDR5にするのか分からんしな
こんなことすると
もう配線が限界じゃ
2008/07/19(土) 01:42 | URL | LGA774 #-[ 編集]
まあ、ぶっちゃけ9割方ネタでしょうね。でも、話の種にはなるでしょう。
うちの掲載基準はその話題が酒の肴になるかならないかですので(ようは楽しんでいただければいいと思っています)。
うちの掲載基準はその話題が酒の肴になるかならないかですので(ようは楽しんでいただければいいと思っています)。
あと1年はnvidiaの新規はないでしょ
2008/07/19(土) 08:05 | URL | sasa #-[ 編集]
nvidia包囲網ですな
2008/07/19(土) 12:16 | URL | LGA774 #-[ 編集]
700mm^2くらいなら生産コストはともかく、
1チップ辺りの性能で優位を保つのは余裕でしょう
250mm^2以下のAMDのチップに売上はフルボッコでしょうけど
1チップ辺りの性能で優位を保つのは余裕でしょう
250mm^2以下のAMDのチップに売上はフルボッコでしょうけど
2008/07/20(日) 02:18 | URL | LGA774 #-[ 編集]
マルチスレッドが進まないCPUと違ってGPUはリニアに性能伸ばせるからなぁ。
1チップが弱くても2チップで巨大ダイに対抗出来るのが強みだわ。
とはいえCUDA見越した設計だし肥大化した原因からして小チップ化は無理だろうな。
1チップが弱くても2チップで巨大ダイに対抗出来るのが強みだわ。
とはいえCUDA見越した設計だし肥大化した原因からして小チップ化は無理だろうな。
2008/07/20(日) 16:24 | URL | LGA774 #-[ 編集]
倍精度浮動小数点演算ユニットってやっぱり相当の肥大化要素なのか・・・
大人しくRadeonみたいに、単精度のSP使って倍精度演算を実装すれば良かったのかなぁ
大人しくRadeonみたいに、単精度のSP使って倍精度演算を実装すれば良かったのかなぁ
2008/07/21(月) 00:44 | URL | moge #-[ 編集]
RADEONも現在は単精度ユニットを複数使って倍精度を実現しているけど、あくまで単精度の性能が重要なグラフィック用途がメインだからであって、GPGPUへの対応を本格的に行うために、倍精度ユニットの搭載にシフトすると思うのですが。
2008/07/21(月) 08:48 | URL | rabbit #-[ 編集]
ふと思ったが、倍精度ユニットで
単精度演算を2個行うのは難しいの?
単精度演算を2個行うのは難しいの?
2008/07/21(月) 12:05 | URL | LGA774 #-[ 編集]
>単精度演算を2個行うのは難しいの?
難易度は低いが、思いっきり遅くなる。
そういうことをするくらいなら、倍精度の演算ユニットを搭載させた方がずっとよくなる。
難易度は低いが、思いっきり遅くなる。
そういうことをするくらいなら、倍精度の演算ユニットを搭載させた方がずっとよくなる。
2008/07/21(月) 13:21 | URL | LGA774 #-[ 編集]
>倍精度の演算ユニットを搭載させた方がずっとよくなる。
文脈から察すると単精度の間違いでは?
文脈から察すると単精度の間違いでは?
2008/07/21(月) 13:58 | URL | LGA774 #-[ 編集]
倍精度ユニットを中心とした場合、GPUとして単精度の演算をさせる時には遊んでいるトランジスタが多くなる
これはつまり、GPUとしては性能の割にはダイが大きくコストパフォーマンスの悪いものになる
一方、GPGPUに期待されているのは、安い汎用品を大量に束ねてコストパフォーマンスの良い計算機が作れる点
つまり、GPU市場で大量に需要があり安価に製造できる製品を流用することに意味がある
要するに、GPUの側から見てコストパフォーマンスが悪く、市場に大量に出ない製品になった場合
GPGPUで求められるコストパフォーマンスの高さを得られない事になる
GPGPUは技術的な面ではCPUや専用機よりも制約が多いものであるから
圧倒的なコストパフォーマンスが得られなければ市場には受け入れられない
これはつまり、GPUとしては性能の割にはダイが大きくコストパフォーマンスの悪いものになる
一方、GPGPUに期待されているのは、安い汎用品を大量に束ねてコストパフォーマンスの良い計算機が作れる点
つまり、GPU市場で大量に需要があり安価に製造できる製品を流用することに意味がある
要するに、GPUの側から見てコストパフォーマンスが悪く、市場に大量に出ない製品になった場合
GPGPUで求められるコストパフォーマンスの高さを得られない事になる
GPGPUは技術的な面ではCPUや専用機よりも制約が多いものであるから
圧倒的なコストパフォーマンスが得られなければ市場には受け入れられない
2008/07/21(月) 15:39 | URL | LGA774 #0b7kWkts[ 編集]
え?GPGPUってゲームでしか使わないようなもんを、他の分野にも生かしてしまおうって技術じゃないの?
GPGPUの技術がCPUや専用機なんかにとって変われるようなものではないのは百も承知のはず。つか常識。
NVIDIAのPhysXにしても、一ゲームにとって液晶が大半を占める中では実質60フレーム/秒以上の処理は必要ないんだから、余る部分を別の処理にまわしてしまおうって話なだけでしょ。PhysX使ったUT3なんて軽く60超えてるんだし。
つか、PhysXがハード(PPU・GPGPU)・ソフト(CPU)の双方で同じ処理ができないのが致命的だと思うんだけど…
こんなのじゃ、比べられる基準がなくてどの程度効果的なのかさっぱりわからない。
GPGPUの技術がCPUや専用機なんかにとって変われるようなものではないのは百も承知のはず。つか常識。
NVIDIAのPhysXにしても、一ゲームにとって液晶が大半を占める中では実質60フレーム/秒以上の処理は必要ないんだから、余る部分を別の処理にまわしてしまおうって話なだけでしょ。PhysX使ったUT3なんて軽く60超えてるんだし。
つか、PhysXがハード(PPU・GPGPU)・ソフト(CPU)の双方で同じ処理ができないのが致命的だと思うんだけど…
こんなのじゃ、比べられる基準がなくてどの程度効果的なのかさっぱりわからない。
2008/07/21(月) 17:40 | URL | LGA774 #-[ 編集]
まぁ、結局、GPUに求められているのは「そこそこの演算制度」と「高速性」なんだよな。
一方のGPGPUに求められているのは「高精度の演算性能」と「高速性」であって、どうしても齟齬が生じる。
それと。
>GPGPUってゲームでしか使わないようなもんを、他の分野にも生かしてしまおうって技術じゃないの?
違うから。
GPGPUは、GPUがベクトル演算をすることを生かして、CPUのようなスカラ型演算では低速な処理を、GPUが代用してもらうことで高速化しようという話だから。
スカラ型だとかベクトル型ってのがわからないなら、自分で調べてくれ。
要はGPUを一つのスーパーコンピュータとして扱い、CPUの浮動小数点演算を肩代わりしてもらおうという話。
もっとわかりやすく言えば、今のSSEみたいな感じの新命令を追加して、その命令の処理をGPUが担う形になると思ってくれれば、ほぼ正解。
一方のGPGPUに求められているのは「高精度の演算性能」と「高速性」であって、どうしても齟齬が生じる。
それと。
>GPGPUってゲームでしか使わないようなもんを、他の分野にも生かしてしまおうって技術じゃないの?
違うから。
GPGPUは、GPUがベクトル演算をすることを生かして、CPUのようなスカラ型演算では低速な処理を、GPUが代用してもらうことで高速化しようという話だから。
スカラ型だとかベクトル型ってのがわからないなら、自分で調べてくれ。
要はGPUを一つのスーパーコンピュータとして扱い、CPUの浮動小数点演算を肩代わりしてもらおうという話。
もっとわかりやすく言えば、今のSSEみたいな感じの新命令を追加して、その命令の処理をGPUが担う形になると思ってくれれば、ほぼ正解。
2008/07/21(月) 20:47 | URL | LGA774 #-[ 編集]
追加で。
>ふと思ったが、倍精度ユニットで
>単精度演算を2個行うのは難しいの?
128Bitレジスタで64Bit命令を2個放り込むやり方は、ちょうどSIMDの発想と同じで、コレは今でもやってる。
というか、問題点はそういう部分じゃないんだよね。
倍精度演算になると、半導体あたりの演算効率は半分になるし、メモリに流れるデータ量は2倍に増える。
要は「動作クロック半分」で「メモリ幅半分」のGPUが出来上がると思えば、最もハッピーなケースになる。
実際にはメモリ幅だけが圧迫されるわけではなく、GPU内のキャッシュも大幅に圧迫されるし、データコピーの時間だって2倍以上に増える。
全体で見れば単精度演算の3割以下ってのが現実になるんじゃないか。
>ふと思ったが、倍精度ユニットで
>単精度演算を2個行うのは難しいの?
128Bitレジスタで64Bit命令を2個放り込むやり方は、ちょうどSIMDの発想と同じで、コレは今でもやってる。
というか、問題点はそういう部分じゃないんだよね。
倍精度演算になると、半導体あたりの演算効率は半分になるし、メモリに流れるデータ量は2倍に増える。
要は「動作クロック半分」で「メモリ幅半分」のGPUが出来上がると思えば、最もハッピーなケースになる。
実際にはメモリ幅だけが圧迫されるわけではなく、GPU内のキャッシュも大幅に圧迫されるし、データコピーの時間だって2倍以上に増える。
全体で見れば単精度演算の3割以下ってのが現実になるんじゃないか。
2008/07/21(月) 20:57 | URL | LGA774 #-[ 編集]
>もっとわかりやすく言えば、今のSSEみたいな〜
SSEって演算結果出るまでは遅いが、複数のデータを同時に処理できるから結果として早くなるって感じでしたよね。
だったら単精度ユニットを複数使って倍精度を実現しても、ユニット数を増やしてフォローできれば方向として有りなのかな?
SSEって演算結果出るまでは遅いが、複数のデータを同時に処理できるから結果として早くなるって感じでしたよね。
だったら単精度ユニットを複数使って倍精度を実現しても、ユニット数を増やしてフォローできれば方向として有りなのかな?
2008/07/21(月) 20:58 | URL | LGA774 #-[ 編集]
>だったら単精度ユニットを複数使って倍精度を実現しても、ユニット数を増やしてフォローできれば方向として有りなのかな?
いや〜、どうなんだろう?
結局AMDが言うGPGPUってのがSSEの置き換えみたいな感じなら、確かにそう言う使い方もあると思うけど、それならSSEを拡張すればいいような気もする。
AMDの主張を聞くと、ある処理ルーチンを全てGPGPU専用命令で作り、それをGPUに送る事によってGPU自身が自発的に処理することを目指しているように思う。
勿論CPUとGPUは相互でやりとりしながらだけど。
後者なら、単精度を複数使って倍精度を実現ってのは…微妙。
下手すればSSEよりも遅くなりかねないから…
いや〜、どうなんだろう?
結局AMDが言うGPGPUってのがSSEの置き換えみたいな感じなら、確かにそう言う使い方もあると思うけど、それならSSEを拡張すればいいような気もする。
AMDの主張を聞くと、ある処理ルーチンを全てGPGPU専用命令で作り、それをGPUに送る事によってGPU自身が自発的に処理することを目指しているように思う。
勿論CPUとGPUは相互でやりとりしながらだけど。
後者なら、単精度を複数使って倍精度を実現ってのは…微妙。
下手すればSSEよりも遅くなりかねないから…
2008/07/21(月) 21:15 | URL | LGA774 #-[ 編集]
>ユニット数を増やしてフォローできれば方向として有りなのかな?
RV770はこのやり方ですね。
RV770はこのやり方ですね。
2008/07/21(月) 21:25 | URL | LGA774 #-[ 編集]
将来は
ラデオン=単精度ユニット満載、倍精度は複数の単精度ユニットで実現(現状のまま)
FireStream=ROPやTMUを削り、単精度ユニットをなくし、倍精度ユニットだけを搭載して、倍精度の性能を数倍にする(RADEONをベースにGPGPUに特化)
みたいに、
ラデオンの使いまわしだと、ララビーに対抗するのはきついと思うので、それぞれ作り分けるんじゃないかな。
ラデオン=単精度ユニット満載、倍精度は複数の単精度ユニットで実現(現状のまま)
FireStream=ROPやTMUを削り、単精度ユニットをなくし、倍精度ユニットだけを搭載して、倍精度の性能を数倍にする(RADEONをベースにGPGPUに特化)
みたいに、
ラデオンの使いまわしだと、ララビーに対抗するのはきついと思うので、それぞれ作り分けるんじゃないかな。
2008/07/22(火) 02:52 | URL | rabbit #-[ 編集]
倍精度実数ユニットが肥大化する原因のひとつは、レジスタなんですけどね。
細かい事を抜きで話すと、単純に2倍になるわけで。
ATiがGPUをGPGPUにも対応させているのに対して、nVidiaはGPGPUをGPUにも使っているという考え方でいいと思う。
当然コストパフォーマンスは前者ですけどね。
細かい事を抜きで話すと、単純に2倍になるわけで。
ATiがGPUをGPGPUにも対応させているのに対して、nVidiaはGPGPUをGPUにも使っているという考え方でいいと思う。
当然コストパフォーマンスは前者ですけどね。
2008/07/22(火) 10:04 | URL | LGA774 #GCA3nAmE[ 編集]
しかしRV770の倍精度200Gflopsに対しGT200の80GflopsぽっちじゃいくらCUDAがあっても…
2008/07/22(火) 16:58 | URL | LGA774 #-[ 編集]
でもGT200は単精度、倍精度を同時に利用できるのでは?
Radeonは同時利用は無理なんでしょ?
Radeonは同時利用は無理なんでしょ?
2008/07/22(火) 21:48 | URL | LGA774 #-[ 編集]
同時に利用したらメモリとか食い合ってどっちも性能が落ちると思うけどな
2008/07/23(水) 00:40 | URL | LGA774 #-[ 編集]
GT200は専用の実行ユニットを載せているから、単精度で良い場所と倍精度を必要な場所で、処理を割り振れるのがメリットだよな。
メモリ食い合いの速度低下も最小限で済むし。
ま、何れにせよ、対応アプリが出てこないとなんともいえないけど。
方向性としてSSEの256Bit化やら512Bit化もありうるわけで、それでもGPGPUのほうがメリットが大きいといえないと、普及は無理。
512Bit化したら、32Bitなら16個同時に演算だからな…
メモリ食い合いの速度低下も最小限で済むし。
ま、何れにせよ、対応アプリが出てこないとなんともいえないけど。
方向性としてSSEの256Bit化やら512Bit化もありうるわけで、それでもGPGPUのほうがメリットが大きいといえないと、普及は無理。
512Bit化したら、32Bitなら16個同時に演算だからな…
2008/07/23(水) 08:43 | URL | LGA774 #-[ 編集]
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/2142-20a2c3d5
この記事にトラックバックする(FC2ブログユーザー)
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック
HARDSPELLにGeForceとRadeonの次期ハイエンドGPUの仕様が掲...
2008/07/20(日) 10:38:06 | PINUPS - 上田新聞 blog版
