Intel Sheds Light on "Larrabee", Dismisses NVIDIA CUDA(DailyTech)
NVIDIAはCUDAプログラミング言語でデータ演算においてIntelに対抗しようとしている。IntelのDigital Enterprise Groupのco-general managerであるPat Gelsinger氏がCustom PCに語ったところによると、NVIDIAのCUDAプログラミングモデルはコンピューターの歴史の中のひとつの足跡にしかならないという。
NVIDIAはCUDAプログラミング言語でデータ演算においてIntelに対抗しようとしている。IntelのDigital Enterprise Groupのco-general managerであるPat Gelsinger氏がCustom PCに語ったところによると、NVIDIAのCUDAプログラミングモデルはコンピューターの歴史の中のひとつの足跡にしかならないという。
Gelsinger氏によると、プログラマーはCUDAのような新アーキテクチャに対しプログラミング法を学べるほど十分な時間はないという。
「このプログラミングモデル(CUDAのこと)はなかなか良いアイデアだ、そして10倍または20倍の性能向上を約束するだろう。しかし、これには新しいプログラミングモデルというとても小さな穴を通過しなければならない。この小さな穴は一般向けコンピューティングモデルでは超えられるものではなかった」
Gelsinger氏はSonyのCellアーキテクチャを引き合いに出し、Cellは今までの通常のアーキテクチャと比較して非常に大きな性能アップを約束するものの、そのアーキテクチャは未だにデベロッパーに広くサポートされてないと述べた。
Intelの“Larrabee”はIntel Architeture x86 coreをベースとするとGelsinger氏は述べている。その理由はデベロッパーが新しい言語を覚えることなく“Larrabee”向けにプログラムを組めるようにするためであるとしている。“Larrabee”はDirectXやOpenGLといったAPIをフルにサポートする。
Intelの主張ではNVIDIAのCUDAは確かに大きな性能向上をもたらすことが可能だが新しいプログラム言語であるがゆえに、開発者に負担を強いることになって最終的には十分性能を生かしきれないとしています。その一方で“Larrabee”は既存のIntel Architecture x86 coreをベースとすることで新しい言語の習得という負担を開発者に強いないと述べています。
ノートPCは
PCパーツの通販はソフマップ
CD/DVD 買うならタワーレコード
Core i7:
Core i5:
LGA1156マザーボード:
Phenom II:
Athlon II:
Atom搭載マザー:
この記事へのコメント
挑戦状(新しいプログラミングパラダイム)を叩きつける相手は
NVIDIAではなく、ソフトウェア開発者ではなかろうか
NVIDIAではなく、ソフトウェア開発者ではなかろうか
2008/07/03(木) 19:10 | URL | LGA774 #-[ 編集]
新しい言語の習得しなくていいのはわかった。
で、性能は?
で、性能は?
ホントに10倍ならやる価値はある
というのは技術肌のおいらの個人的な感想で、
正直なところ採算性というのには疑問符だな・・・。
とりあわけ海千山千な新技術ってのはなー。
というのは技術肌のおいらの個人的な感想で、
正直なところ採算性というのには疑問符だな・・・。
とりあわけ海千山千な新技術ってのはなー。
2008/07/03(木) 20:17 | URL | LGA774 #-[ 編集]
新しい言語やアーキテクチャを覚えなおす労力をいとわない人は、HPC分野や科学計算分野だけでしょうね。
これは今までもこれからも変わらないでしょう。
ソフトウェアや身に付けた知識技術を次の機種や次の世代に継承できるのかと心配も常に付きまといます。
Intelはそれこそ頑なに互換を維持することで今の隆盛を築きました。
ソフトウェア開発者も多くのソフトや知識を長期間積み上げて熟達してきたわけです。
ハードの進化は早い。でも、ソフトウェアやそれをつくる技術者の進歩は遅い。
これは歴史が示してます。
これは今までもこれからも変わらないでしょう。
ソフトウェアや身に付けた知識技術を次の機種や次の世代に継承できるのかと心配も常に付きまといます。
Intelはそれこそ頑なに互換を維持することで今の隆盛を築きました。
ソフトウェア開発者も多くのソフトや知識を長期間積み上げて熟達してきたわけです。
ハードの進化は早い。でも、ソフトウェアやそれをつくる技術者の進歩は遅い。
これは歴史が示してます。
2008/07/03(木) 20:50 | URL | f #CISG.8fo[ 編集]
あれ、AMDは…?
2008/07/03(木) 21:20 | URL | LGA774 #t50BOgd.[ 編集]
こういうのって、相手に酷いこと言ってるときほど相手がすごいんだよね
x86の群れよりは、GPGPUのほうが使いやすいんだろうか……一応専用設計だし
x86の群れよりは、GPGPUのほうが使いやすいんだろうか……一応専用設計だし
2008/07/03(木) 21:42 | URL | (゜ω゜=゜ω゜) #-[ 編集]
>ハードの進化は早い。でも、ソフトウェアやそれをつくる技術者の進歩は遅い。
というか、これがx86の呪縛なんだよな。
「過去の資産を流用できるから」x86が使われている中で、「わざわざ別のやり方を覚える」なら、x86なんて使う意味が無いんだよな。
もっとハッキリ言えば、新しいプログラム方法を覚えるなら、非効率極まり将来性も疑問符がつくx86やx64などではなく、ゲーム機に使われるであろうPowerや携帯で使われるArmの方が、投資効率がいい。
となると、何で「コストをかけてまで習得しなければならないのか」という話になる。
まぁ、そういうわけで、別に技術者の進歩が遅いというわけではなく、費用対効果の話だな。
Armの最適化は急速に進むし、ゲーム機のCPUの使用率も急激に上がっているから、技術が無いというわけではないんだよな。
というか、これがx86の呪縛なんだよな。
「過去の資産を流用できるから」x86が使われている中で、「わざわざ別のやり方を覚える」なら、x86なんて使う意味が無いんだよな。
もっとハッキリ言えば、新しいプログラム方法を覚えるなら、非効率極まり将来性も疑問符がつくx86やx64などではなく、ゲーム機に使われるであろうPowerや携帯で使われるArmの方が、投資効率がいい。
となると、何で「コストをかけてまで習得しなければならないのか」という話になる。
まぁ、そういうわけで、別に技術者の進歩が遅いというわけではなく、費用対効果の話だな。
Armの最適化は急速に進むし、ゲーム機のCPUの使用率も急激に上がっているから、技術が無いというわけではないんだよな。
2008/07/03(木) 21:44 | URL | LGA774 #-[ 編集]
必死に習得したとして…
それがすぐ消えたら虚しいですよね、
こういうのは流れに乗らないとなかなか難しい気がする…
それがすぐ消えたら虚しいですよね、
こういうのは流れに乗らないとなかなか難しい気がする…
2008/07/03(木) 21:54 | URL | BLACK #-[ 編集]
でもさ、やっぱ負担は減らせるし、
歩み寄ってる感はあるよね。
すげー速いの作ったからついて来いっても、なかなか押し付けがましくてさ。実際ゆったりと移動を促してくやり方は好感がもてる。
歩み寄ってる感はあるよね。
すげー速いの作ったからついて来いっても、なかなか押し付けがましくてさ。実際ゆったりと移動を促してくやり方は好感がもてる。
2008/07/03(木) 22:00 | URL | LGA774 #-[ 編集]
ハードの性能は物理法則で規定されるんだから、性能出したければハードに合わせてソフトが変わるしかないだろうと思うんだが…。
x86だってマルチコア化で既にそれは現実になってるわけで。
努力を怠る者は落伍するのみ。そして、怠け者に合わせてハードウェアを造る必要はないだろうと思う。
もちろん、この程度のことはインテルも理解しているはず。
x86だってマルチコア化で既にそれは現実になってるわけで。
努力を怠る者は落伍するのみ。そして、怠け者に合わせてハードウェアを造る必要はないだろうと思う。
もちろん、この程度のことはインテルも理解しているはず。
2008/07/03(木) 23:06 | URL | LGA774 #-[ 編集]
急激な変化を要求しても、大きな流れを作るのはなかなか
難しいものだよ。そういうのを強者の論理っての?怠け者とはニュアンスが違うと思うがね。
難しいものだよ。そういうのを強者の論理っての?怠け者とはニュアンスが違うと思うがね。
2008/07/03(木) 23:27 | URL | LGA774 #-[ 編集]
エンドユーザーが見えてる層と
そうでない層の意識差ってのは
きっと、ずーっとなくならないんだろうなと思う
どっちも良い製品を作ろうとはしてるんだけど
そうでない層の意識差ってのは
きっと、ずーっとなくならないんだろうなと思う
どっちも良い製品を作ろうとはしてるんだけど
2008/07/03(木) 23:33 | URL | LGA774 #-[ 編集]
Larrabeeも結局Larrabee用にコード組んでくれって事なんですかね?
CUDAもだけど、こういうのって自社のみじゃなくて競合他社でも巻き込んで展開しないと普及するの時間かかると思うんだけど、なんでそうしないんでしょうね?
CUDAもだけど、こういうのって自社のみじゃなくて競合他社でも巻き込んで展開しないと普及するの時間かかると思うんだけど、なんでそうしないんでしょうね?
2008/07/03(木) 23:47 | URL | LGA774 #-[ 編集]
Larrabeeはx86だから、従来のマルチCPU向けに書いたコードでもそのままか、
微修正でもそれなりのパフォーマンスで動くけど、
Larrabee向けに最適化すればさらにパフォーマンスが上がるってのを
intelとしては売りにしたいんじゃないかな?
GPGPUだと一から書き直しなので、それくらいしかLarrabeeのメリットってなさそうだけど。
微修正でもそれなりのパフォーマンスで動くけど、
Larrabee向けに最適化すればさらにパフォーマンスが上がるってのを
intelとしては売りにしたいんじゃないかな?
GPGPUだと一から書き直しなので、それくらいしかLarrabeeのメリットってなさそうだけど。
2008/07/03(木) 23:51 | URL | LGA774 #-[ 編集]
CUDA1は業務アプリでは使い物にならないよ
結局のところ
1.条件分岐のペナルティ
2.アレイの特定の要素のみの参照へのペナルティ
これのおかげで、SSE最適化程度のプログラムでは、全くCUDAの特性を生かしきれない
NVIDIAが言う夢のパフォーマンスは嘘ではないけど、それを適用できるアプリはごく限られている
結局のところ
1.条件分岐のペナルティ
2.アレイの特定の要素のみの参照へのペナルティ
これのおかげで、SSE最適化程度のプログラムでは、全くCUDAの特性を生かしきれない
NVIDIAが言う夢のパフォーマンスは嘘ではないけど、それを適用できるアプリはごく限られている
2008/07/04(金) 00:37 | URL | LGA774 #KFepHijc[ 編集]
ハード屋が思ってるほどには、手続きを細かい粒度に分割できないと思うだよ俺
人が使うもんだからどうしてもシーケンシャルなものになる
人が使うもんだからどうしてもシーケンシャルなものになる
2008/07/04(金) 00:49 | URL | LGA774 #-[ 編集]
x86用に最適化したコードでCUDAに最適化出来るスーパーコンパイラを提供してくれれば乗り換えるYO!
2008/07/04(金) 00:58 | URL | LGA774 #-[ 編集]
どうでもいいから、Larrabee早く出してくれないとね。
2008/07/04(金) 07:44 | URL | nukos #j7kPgX2Q[ 編集]
>ハードの性能は物理法則で規定されるんだから、性能出したければハードに合わせてソフトが変わるしかないだろうと思うんだが…。
ハードの性能は物理法則以外に、理論的な話の影響もかなり多い。
命令セットなんてのは理論的な話そのもので、物理的には高速なCPUでも、x86命令を使っているから遅くなっているのが、今のPC向けCPUの現状。
PC向けCPUの発熱量が何故大きいのかと問われれば、時代遅れとしか言いようの無い、8Bit時代から引きずっているような命令を動かそうとしているからに他ならない。
要は、低発熱で高速化の一番の近道は、x86命令を捨て去ることなんだよな。
ちなみに、その古臭いx86を更に64Bitまで引きずろうとするx64は、低発熱化だとか高速化という話からすれば、論外な選択肢なわけだが。
ネイティブコードをPhenomで走らせれば、それこそx86命令を扱う場合の100倍は高速に処理できる。
逆に言えば、ただ単に「x86命令を扱う」というだけで、僅か数%しか処理に繋げられないということだ。
ハードの性能は物理法則以外に、理論的な話の影響もかなり多い。
命令セットなんてのは理論的な話そのもので、物理的には高速なCPUでも、x86命令を使っているから遅くなっているのが、今のPC向けCPUの現状。
PC向けCPUの発熱量が何故大きいのかと問われれば、時代遅れとしか言いようの無い、8Bit時代から引きずっているような命令を動かそうとしているからに他ならない。
要は、低発熱で高速化の一番の近道は、x86命令を捨て去ることなんだよな。
ちなみに、その古臭いx86を更に64Bitまで引きずろうとするx64は、低発熱化だとか高速化という話からすれば、論外な選択肢なわけだが。
ネイティブコードをPhenomで走らせれば、それこそx86命令を扱う場合の100倍は高速に処理できる。
逆に言えば、ただ単に「x86命令を扱う」というだけで、僅か数%しか処理に繋げられないということだ。
2008/07/04(金) 12:25 | URL | LGA774 #-[ 編集]
小理屈はいいから現物を呉れ.
2008/07/04(金) 15:18 | URL | #PpCXbfmU[ 編集]
x86命令を捨てなかったからこそ得られた物やユーザーの拡大は莫大なわけで。効率論ですべてを削ぎ落として突き進んだとしても一般ユーザーの享受できる恩恵は少なかったと思うよ。
2008/07/04(金) 15:32 | URL | LGA774 #-[ 編集]
x86命令じゃなくて内部命令を直接扱っても、100倍どころか2倍も速度でないよ。
大体100倍も本当に出るなら、x86命令を直接扱えなくても、
従来のアプリはエミュで処理しちゃえばいいだけの話。
大体100倍も本当に出るなら、x86命令を直接扱えなくても、
従来のアプリはエミュで処理しちゃえばいいだけの話。
2008/07/04(金) 15:46 | URL | LGA774 #-[ 編集]
intelはx86で市場を支配したかっただけだろう。それでも企画の乱立で混乱を招くようなこともなく健全に半導体が進化出来たのはintelのおかげでもある。上には上がある。どんなに優れたアーキテクチャもいずれは刷新され、その都度新しいコードを強いられていては頓挫する企画ばかり増え、プログラマは状況に辟易として深く踏み込まなくなりかえってpc全体の進化を鈍化させたと思うがどうだろう。
2008/07/04(金) 15:53 | URL | LGA774 #-[ 編集]
ソフトウェアの互換性なんて誰も必要としていないよ(Vistaのedlinでテキストを編集しながら)
2008/07/04(金) 16:06 | URL | LGA774 #-[ 編集]
互換性あるのはメリットかもしれないけど、パフォーマンスはどうなんだろう。
この分野はとにかく性能なんじゃねーの。
この分野はとにかく性能なんじゃねーの。
2008/07/04(金) 16:08 | URL | #-[ 編集]
まず重要なのは、Larrabeeはベクタ計算が得意なインオーダー型のシンプルコアを数十個実装しするということ。
上の人が言っているように、まさに無駄を削って構造を変えるわけです。
ただ、それを扱うCPU命令セットはx86のままである。というのがIntelのスタンスであり売りです。
x86命令セットに浮動小数点演算命令を拡張する。かつてSSE123でやったような僅かな命令セットの拡張と、それをうまく扱うコンパイラでメニイコアを扱うわけです。
上の人が言っているように、まさに無駄を削って構造を変えるわけです。
ただ、それを扱うCPU命令セットはx86のままである。というのがIntelのスタンスであり売りです。
x86命令セットに浮動小数点演算命令を拡張する。かつてSSE123でやったような僅かな命令セットの拡張と、それをうまく扱うコンパイラでメニイコアを扱うわけです。
2008/07/04(金) 17:14 | URL | f #CISG.8fo[ 編集]
性能が足りてないアプリなら乗り換えるかもしれませんが
多くのそこまでパフォーマンスがクリティカルじゃないアプリ達は
わざわざコード変更が必要な改修はしませんよ。
そんなのするならデザイン変えて売り込んだ方が売れます。
多くのそこまでパフォーマンスがクリティカルじゃないアプリ達は
わざわざコード変更が必要な改修はしませんよ。
そんなのするならデザイン変えて売り込んだ方が売れます。
2008/07/04(金) 17:20 | URL | LGA774 #-[ 編集]
なんだかよくわからん話だが、最新PCゲームがメニイコアの性能を十分に引き出してくれるならそれでいいよ 自分がコード書くわけでも(ry
2008/07/04(金) 18:05 | URL | LGA774 #-[ 編集]
これをつければCPU4コアと性能1/5のコア32個としてOSに認識されるようならば非常に良いのですが
そうでなくGPUとしてしか利用できないのであればx86は不利になるだけですね
そうでなくGPUとしてしか利用できないのであればx86は不利になるだけですね
2008/07/04(金) 18:43 | URL | LGA774 #sSHoJftA[ 編集]
ソフト屋さんの視点として見てみれば。
CUDAとかのGPU向けのC言語を拡張した言語って、どれもほとんどC言語と変わらないよ。
言語学習にコストはほとんどかからない。
問題なのは、大量のスレッドを効率よく使用するための「新しいアーキテクチャに合わせたプログラムをする必要がある」という点。
この点においては、nVidiaのものも、ATIからのものも、Intelから出るものも、たぶん同じなんだよね。
結局、大量にスレッドを立てられるアーキテクチャを効率よく使うプログラムをしなきゃ、Larrabeeだって効率よく使えない。
ソフト屋さんからしたら、「Intelのマネージャーさんってその程度しか自社製品知らんのか」って感じかと。
Intelお得意のコンパイラーで何とかしますって言うなら、話別だろうけど。
CUDAとかのGPU向けのC言語を拡張した言語って、どれもほとんどC言語と変わらないよ。
言語学習にコストはほとんどかからない。
問題なのは、大量のスレッドを効率よく使用するための「新しいアーキテクチャに合わせたプログラムをする必要がある」という点。
この点においては、nVidiaのものも、ATIからのものも、Intelから出るものも、たぶん同じなんだよね。
結局、大量にスレッドを立てられるアーキテクチャを効率よく使うプログラムをしなきゃ、Larrabeeだって効率よく使えない。
ソフト屋さんからしたら、「Intelのマネージャーさんってその程度しか自社製品知らんのか」って感じかと。
Intelお得意のコンパイラーで何とかしますって言うなら、話別だろうけど。
2008/07/04(金) 19:04 | URL | 元ゲーム屋さん #-[ 編集]
従来のアプリをLarrabeeのようなメニーコア系で高速化なんて
intelはあまり考えてないだろうね。
既に沢山のCPUで処理しているようなところをさらに高速化する用だろう。
Ctも並列化しやすい処理だけに対応のようだし、並列化しやすい処理は
Larrabeeやその後継の多数のコアで、
従来型のアプリはCPUの地道な進化でって考えてるんじゃないかな。
intelはあまり考えてないだろうね。
既に沢山のCPUで処理しているようなところをさらに高速化する用だろう。
Ctも並列化しやすい処理だけに対応のようだし、並列化しやすい処理は
Larrabeeやその後継の多数のコアで、
従来型のアプリはCPUの地道な進化でって考えてるんじゃないかな。
2008/07/04(金) 19:16 | URL | LGA774 #-[ 編集]
そうそう、結局高級言語で書くから、x86とかそんなのは関係ない
そのためのプログラミング言語だろ。。。
今時アセンブラとかつかわねーし
そのためのプログラミング言語だろ。。。
今時アセンブラとかつかわねーし
2008/07/04(金) 21:16 | URL | takashi #JalddpaA[ 編集]
低レベルのインターフェースなんてとても提供できないからな
同じメーカーのGPUですら世代変わるとアーキテクチャぜんぜん違うから
同じメーカーのGPUですら世代変わるとアーキテクチャぜんぜん違うから
2008/07/04(金) 21:54 | URL | LGA774 #-[ 編集]
いや、アセンブラまで逆流しなくても、調整は似たものなんだが…
未だにSSEを手動で組み込んでいるのと同じで、どういう処理をどの程度行うのかなんてのは、全て手作業になる。
まぁ、ゲーム機のように、1クロックで云々という話までは行かないけどさ。
未だにSSEを手動で組み込んでいるのと同じで、どういう処理をどの程度行うのかなんてのは、全て手作業になる。
まぁ、ゲーム機のように、1クロックで云々という話までは行かないけどさ。
2008/07/04(金) 22:48 | URL | LGA774 #-[ 編集]
流体計算なんかはGPU使うの流行ってるよね
東大とかnvサポートで研究やってるし
まあ今のハードで今CUDA使って高速化出来るほうが、
楽かもしれないけどいつ出るかわからない
ブツ待つよりかはるかに現実的かと
東大とかnvサポートで研究やってるし
まあ今のハードで今CUDA使って高速化出来るほうが、
楽かもしれないけどいつ出るかわからない
ブツ待つよりかはるかに現実的かと
2008/07/04(金) 22:57 | URL | VIPPERな名無しさん #-[ 編集]
そりゃコンパイラはSSE優先で変換しますからね…
i386で変換する訳にゃいかんですし
i386で変換する訳にゃいかんですし
2008/07/04(金) 23:59 | URL | LGA774 #-[ 編集]
Cellアーキテクチャ?
POWER PCだろ?
POWER PCだろ?
2008/07/05(土) 02:01 | URL | LGA774 #-[ 編集]
CELLもXENONもPOWER PCの子孫ですね
CELL=ソニーみたいに勘違いしてる人達がいるけど
実際はIBMと東芝がPOWER PCベースに作ったものです
CELL=ソニーみたいに勘違いしてる人達がいるけど
実際はIBMと東芝がPOWER PCベースに作ったものです
2008/07/05(土) 10:36 | URL | LGA774 #-[ 編集]
いずれコンパイラが特定の処理(単純なループとか)にたいして自動的にスレッド作り出すようになるでしょう・・・。
コンパイラの一部にはすでに実装済みかな?
コンパイラの一部にはすでに実装済みかな?
2008/07/05(土) 13:39 | URL | LGA774 #-[ 編集]
>Intelお得意のコンパイラーで何とかしますって言うなら、話別だろうけど。
いやー鋭い。あんまり多くはいえませんが、鋭いです。さすがゲーム屋さん。
過去の失敗を糧に出来たいい例だと俺は思う。Gilaというメディアプロセッサを知っているヤツなら、話が早いが。
いやー鋭い。あんまり多くはいえませんが、鋭いです。さすがゲーム屋さん。
過去の失敗を糧に出来たいい例だと俺は思う。Gilaというメディアプロセッサを知っているヤツなら、話が早いが。
2008/07/07(月) 10:44 | URL | 中の人 #-[ 編集]
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/2098-3bccc11b
この記事にトラックバックする(FC2ブログユーザー)
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック




