北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
Does the GeForce GTX 970 have a memory allocation bug ?(Guru3D)
GeForce GTX 970 Design Flaw Caps Video Memory Usage to 3.3 GB: Report(techPowerUp!)

GeForce GTX 970は今期のパフォーマンスセグメントのグラフィックカードとしては最もポピュラーなカードと言えるかもしれない存在でアリ、$329.99の価格としては素晴らしい性能を有している。しかし、とあるパワーユーザーの検証によると、このGeForce GTX 970に不具合があるかもしれないという。GeForce GTX 970でGPUメモリベンチマークを走らせると4GB搭載されているメモリのうち700MB分を利用できないというのだ。
 
この「GeForce GTX 970のメモリ周りの不具合」はVRAMが重視されるゲームでGeForce GTX 970をセットアップした時に気づかれたものであるという。GeForce GTX 980ではこのバグは生じておらず、4GB全てのメモリを使用できる。OCNのForumの管理者がNVIDIAの公式の返答として「現在調査中であり、できるだけ早く更新を行う」というコメントを掲載している。

このメモリ周りの不具合はGeForce GTX 970の無効化されたSMMユニットによって引き起こされるのではないかという考察がされています。

Nai's Benchmark memory allocationは2816MiBytesから3500MiBytesの幅に分布し、このメモリの割り当てが無効化されたSMMユニットと、それぞれのGPUの帯域の相違によって引き起こされるのではないかと推測される。

GeForce GTX 970とGTX 980は4つのRaster Engineを搭載し、それぞれのRaster Engineは4つのSMMユニットを有する。GeForce GTX 980は全てのSMMが有効であるため、合計のSMMの数は16となる。

GeForce GTX 970は3つのSMMが無効となっている。NVIDIAはSMMの無効化がどのような形で行われているかについてはコメントを拒んだ。しかし、多くのレビューを観ると、GeForce GTX 970は4つあるRaster Engineのうち3つは1ユニットずつSMMが無効化されてSMM 3ユニット構成となり、最後の1つは4ユニットのSMMを有するというものであった(3 SMM×3+4 SMM×1)。

1番目に考えられるのは、1つのRaster Engineで3つのSMMが無効化されているものである(1 SMM×1+4 SMM×3)。2番目に考えられるのは1つのRastere Engineで2つのSMMが、もう1つのSMMで1つのSMMが無効化されているものである(2 SMM×1+3 SMM×1+4 SMM×2)。
ここでダイアグラムを見ると、Raster Engineとともにメモリコントローラも接続されていることで、最初のパターンの場合、Raster Engineがメモリコントローラの全ての帯域を使えないということが明らかに起こってくる。


64-bitメモリコントローラが4基で合計256-bitの帯域となる。ここで3 SMM×3+4 SMM×1とする。計算上は16 SMM=256-bit=4096MB、13 SMM=208-bit=3328MBとなり、GeForce GTX 970が実際に扱える帯域は208-bitとなる。

無効化されたSMMユニットがメモリコントローラに悪影響を及ぼし(?)、無効化されたSMMユニットの分の帯域が実際には使われていないという考え方のようです。どこまで本当かどうかは分かりませんが、208-bit=3328MBという数字だけは合っています(後半の訳はかなり怪しいかもしれない・・・)。
今後、これがどこまで生じるものなのか、生じるとすればどのような対処が行われるかが注目されます。



(追記:2015年1月26日22時40分)
NVIDIA Publishes Statement on GeForce GTX 970 Memory Allocation(AnandTech)
Nvidia admits, explains GeForce GTX 970 memory allocation issue(The Tech Report)
グラフィックスメモリを大量に要求するタイトルで,GTX 970の性能が大幅に低下する? 海外で話題の問題についてNVIDIAが見解を公表(4Gamer.net)
GTX 970 3.5GB VRAM Issue(NVIDIA / GeForce Forums)

GeForce GTX 970は4GBのVRAMを搭載する。しかし、GeForce GTX 980とSMの構成が異なり、メモリシステムへのクロスバーのリソースがGTX 980よりも少なくなる。そこで、GeForce GTX 970でのメモリ管理トラフィックを最適にすべく、グラフィックメモリを3.5GBの領域と0.5GBの領域に分割した。そしてGPUはまず3.5GBの領域に優先的にアクセする。ゲームのVRAM要求が3.5GB未満である場合は最初の3.5GBの領域にのみアクセスする。3.5GBを超える場合は両方の領域にアクセスする。サードパーティ製のアプリケーションでメモリ使用量を計測する場合は、GeForce GTX 970では3.5GBのメモリを用いて報告するが、GeForce GTX 980では別のコマンドでより多くのメモリを使えば、それ以上のレポートを返す。

疑問はGeForce GTX 970が0.5GBの領域にアクセスした時の性能についてである。そこでNVIDIAではゲーム性能をテストし、掲載した。GeForce GTX 980とGTX 970で3.5GB未満・以上でゲーム性能を比較した。

Shadow of Morderでは3.5GB未満と以上でGeForce GTX 980では24%の、GTX 970では25%の差が見られた。同様にBattlefield 4では47%と50%、Call of Dutyでは41%と44%である。つまり、GeForce GTX 980とGTX 970で0.5GBの領域にアクセスした場合の性能低下の度合いはごく小さなものにとどまる。

日本語訳は4Gamer.netにも掲載されており、NVIDIAがテストした性能データも掲載されています。



(追記:2015年1月29日21時33分)
GeForce GTX 970: Correcting The Specs & Exploring Memory Allocation(AnandTech)
NVIDIA updates GeForce GTX 970 specifications to 56 ROPs after reports of 3.5GB issue(VideoCardz)
GTX 970 Memory Drama: Plot Thickens, NVIDIA has to Revise Specs(techPowerUp!)
NVIDIA Discloses Full Memory Structure and Limitations of GTX 970(PC Perspective)

NVIDIAのJonah Alben氏 (SVP of GPU engineering) によりGM204のダイアグラムが示され、GeForce GTX 980とGTX 970の違いについて説明が行われた。GeForc GTX 970のROPは56しかなく、L2キャッシュ容量もGeForce GTX 980よりも少なくなる。更新されたGeForce GTX 970のスペックでは8つあるL2キャッシュモジュールのうち1つが無効化され、合計のL2キャッシュは2048KBではなく1792KBとなる。これらのL2キャッシュモジュールはそれぞれ0.5GB分のDRAMモジュールに直接接続されている。

GeForce GTX 970はメモリに2つの領域を持っており、このうち3.5GBは最大速度を出すことができる。残る0.5GBは3.5GBの領域を使い尽くした場合にのみ使われるが、この領域は3.5GBの領域の1/7の速度しか出ない。

技術的には最初の領域を使い切るまでは、3.5GBの領域に224-bitインターフェースで接続していることになる。

これを踏まえて修正したスペックが以下となります。

GeForce
GTX 980GTX 970GTX 960
コア・プロセスGM204 28nmGM206 28nm
SMM数16138
CUDA core数204816641024
TMU数12810464
コア周波数Base1126MHz1051MHz1127MHz
Boost1216MHz1178MHz1178MHz
搭載メモリGDDR5 4GBGDDR5 4GB→3.5GB+0.5GBGDDR5 2GB
メモリ周波数1753MHz
(7012MHz)
1753MHz
(7012MHz)
1753MHz
(7012MHz)
メモリインターフェース256-bit256-bit128-bit
ROP数6464→5632
L2キャッシュ2048KB2048KB→1792KB1024KB
TDP165W
6-pin×2
145W
6-pin×2
120W
6-pin
価格$549
'14/9/19
$329
'14/9/19
$199
'15/1/22


GeForce GTX 970 ダイアグラム (2015年1月29日)

ダイアグラムを見るとSMM群がCrossbarに接続され、そのCrossbarからL2キャッシュとメモリコントローラが接続されています。L2キャッシュは8つのモジュールから構成されており、それぞれのL2キャッシュモジュールには1つのメモリコントローラが接続されています。GM204の場合はメモリコントローラが8つあるので32-bit×8=256-bitとなるのでしょう。GeForce GTX 970の場合はL2キャッシュモジュールのうち1つが無効化されているため、その無効化されたL2キャッシュモジュールに接続されているメモリコントローラへのアクセスが非常に遅くなり、そのためそのメモリコントローラに接続されている1/8のメモリ領域=512MB分へのアクセスが遅くなるようです。しかし、このブロックダイアグラムを見る限りでは今回のメモリ騒動の原因はL2キャッシュの無効化が原因でSMMの無効化は直接関係ないように見え、L2キャッシュの無効化を行っていなければこんな騒動も起こらなかったように思えてしまいます。
いっそのことGeForce GTX 970は224-bitメモリインターフェース+GDDR5 3.5GB搭載として若干コストを下げた上で出直すのは良いのではないでしょうか224-bit, 3.5GBなんて変態っぽくて素敵

NVIDIA to Tune GTX 970 Resource Allocation with Driver Update(techPowerUp!)
GTX 970 3.5GB VRAM Issue(GeForce Forums)

NVIDIAはGeForce GTX 970のメモリ割り当て問題に対する修正をリリースする計画であるようだ。GeForce Forums内で、NVIDIAは性能を向上させるためのメモリ割り当てを調整する更新ドライバを開発していると述べた。

修正ドライバを開発している模様です。まずこれでどうなるか見守ることになるでしょうか。

関連記事



○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源

コメント
この記事へのコメント
146871 
問題については知っていても、なぜ起きたのかは知らないままだった
非常にありがたい記事

とはいえGTX970持ってないんですけども
2015/01/25(Sun) 13:21 | URL | LGA774 #-[ 編集]
146872 
その個体がたまたまVRAMの不良なんじゃないかな
流石にVRAM全領域使えない「仕様」で大量生産して出荷まで行かないでしょう
2015/01/25(Sun) 13:37 | URL |   #-[ 編集]
146873 
ん?
このクラスのGPUにはメモリの大きさも期待されてるのに、
700MBしか使えない場合があるなら大きな問題だな
2015/01/25(Sun) 13:40 | URL | LGA774 #-[ 編集]
146874 
GTX960を作る時、GM204を真っ二つにして、その結果メモリインターフェースも真っ二つになってたからな。記事の推測はあながち間違って無さそう。
2015/01/25(Sun) 14:07 | URL | LGA774 #-[ 編集]
146875 
記事を読むと、バグではなく仕様(意図してそうなっている)かも。ただその場合でも、4MBメモリとして売ったのは問題かと。3.25GBメモリとして売っていれば、仕様で済んだ気がします。
2015/01/25(Sun) 14:16 | URL | masa #jYbOzkUY[ 編集]
146877 
この記事だね
これを見る限り個体差で片付けられる位レベルではないけど、Aero切れば問題ないって感じ
http://jisakutech.com/archives/21329095.html
2015/01/25(Sun) 14:42 | URL | LGA774 #-[ 編集]
146878 
Nai's Benchmark memory allocationを走らせてみたけど既に使用されている領域は綺麗に速度が落ちるね
使用されてる領域はGPU-Zで見られる値
OSはWin10TP Build9926
980と970の比較画像はこれ同じ環境で走らせてないんじゃないかって気がする
2015/01/25(Sun) 15:05 | URL | LGA774 #c7k2OGQI[ 編集]
146881 
某巨大掲示板の9xxスレにて現在進行形で騒ぎになってますね
どんな結末を迎えるやら...
2015/01/25(Sun) 16:46 | URL | LGA774 #-[ 編集]
146885 
※146877
そこのまとめ記事は必要な情報欠落しすぎてるから当てにならん
Aero切ればだいたい大丈夫なのは970以外のグラボ
970はAero切っても3200MBから異常な落ち込み
2015/01/25(Sun) 17:30 | URL | LGA774 #-[ 編集]
146889 
970に関してはAero関係なく、
メモリーに対してメモコン不足っていうかなり物理的な原因だからな

2015/01/25(Sun) 19:37 | URL | LGA774 #JalddpaA[ 編集]
146893 
TITANでも5500-5800MBで15-30GB/Sくらいだった
2015/01/25(Sun) 20:53 | URL | LGA774 #-[ 編集]
146895 
実際は3328MB以上使えて、テクスチャユニットあたりの帯域差はなくメモリの速度は実は出ているという落ちのような気もする
所詮カット版、上位と同じ性能をどのような条件でも求めるのは無理
2015/01/25(Sun) 21:45 | URL | LGA774 #-[ 編集]
146899 
nVidia公式から回答があったらしいね。
どうもプロセッサ削られてる事によるメモリ割り当ての違いで起こるみたいだが、
ドライバレベルでどうにかなるのか。
2015/01/26(Mon) 03:50 | URL | LGA774 #KfkS430g[ 編集]
146901 
980Mとかはどうなんでしょうね。もっと削ってる筈なんだけど、、、
2015/01/26(Mon) 08:35 | URL | 木津健介 #-[ 編集]
146903 
「208-bit=3328MB」ってなんだろう?
アドレスバスとデータバスがごっちゃになってない?
2015/01/26(Mon) 10:44 | URL | LGA774 #Qf9PJiys[ 編集]
146905 
結果如何では、無駄なメモリチップをつけて出荷していたということにもなりかねないのかな?
チップあたりの容量にもよるけど。
ドライバで解決できるといいけどね。
2015/01/26(Mon) 13:33 | URL | LGA774 #-[ 編集]
146906 
nVidiaは仕様上こうなってるって説明してるらしいから、ソフト側での対応するとしても速度低下する容量分使わないようにするとかせざるを得ないんじゃないかね?
2015/01/26(Mon) 13:40 | URL | LGA774 #-[ 編集]
146907 
つまり俺に970じゃなく980を買わせたいのか、買ってやるよ!
2015/01/26(Mon) 15:19 | URL | LGA774 #-[ 編集]
146908 
相変わらず仕様で片付けるのかnVIDIAは
はよリコールしろ
買ってしまったんだ、絶対許さんぞ
2015/01/26(Mon) 18:25 | URL | LGA774 #-[ 編集]
146911 
>所詮カット版、上位と同じ性能をどのような条件でも求めるのは無理

NVIDIAの公式サイトには970のVRAMは4GBの256bitで帯域幅224GB/sって明記しちゃってるし
それが罷り通ったら980だろうがTitanだろうがハイエンドで同じ事されても文句言えないw
2015/01/26(Mon) 20:50 | URL | LGA774 #-[ 編集]
146917 
http://www.4gamer.net/games/274/G027467/20150126004/
> GTX 970はGTX 980よりもグラフィックスメモリとのクロスバー接続が少ないという制約があるため,
> 3.5GBの境界を超えるグラフィックスメモリの使用が発生した場合は,GTX 980よりも性能低下の度合いが大きくなる
つまり今回の件はエラッタではなくハードの仕様ということになる。
特定のゲームに3.5GBリミッタが掛かってることからも、事前に把握していたと考えてまず間違いない。

> グラフィックスメモリ使用量が3.5GBを超えた場合でも,GTX 970の性能低下率は,GTX 980比で1~3%程度大きくなるに留まると主張している。
ユーザーが違和感を覚えて検証したから発覚したのに、平均フレームレート(お得意のFCATはどうした?w)の差が
数%だから大した問題じゃないみたいな言い訳は通用しない。

はっきり言って、ユーザーを嘗めてるとしか言い様がないね。
こういうふざけた会社はいっぺん潰れた方がいいと思う。
2015/01/26(Mon) 23:20 | URL | LGA774 #-[ 編集]
146918 
またリコール扱い無しだろな
2015/01/26(Mon) 23:25 | URL | LGA774 #-[ 編集]
146923 
146908>
http://ascii.jp/elem/000/000/420/420986/
ここのどこにあったのか忘れたんだけど、今やウェハーからチップの
完成品ができあがるまで1月以上はかかるみたいなので、リコールが
かかると結構待たされる事にはなるね。
2015/01/27(Tue) 06:30 | URL | 木津健介 #-[ 編集]
146927 
970値段下がるかも!ッて思ったけど、
960あるから下げれないよね…
2015/01/27(Tue) 10:07 | URL | LGA774 #-[ 編集]
146930 
メモリの帯域そのものは同じだと思うけどね
ただカットされているから引き出せる性能は限定されるのは当たり前で場合によっては980やその他でもピーク性能は得られない
2015/01/27(Tue) 12:47 | URL | LGA774 #-[ 編集]
146931 
追記部分で紹介してる公式掲示板の見解、虚偽だった可能性が…。
公式発表した仕様と実際の構造が異なる以上、景品表示法違反の疑いが濃厚に…。
これ詐欺事件として本国で集団訴訟される可能性もあるんじゃない?
2015/01/27(Tue) 15:03 | URL | LGA774 #-[ 編集]
146936 
>性能低下の度合いはごく小さなものにとどまる

純粋にメモリ帯域幅が劇的に低下するという話なのに
高々数種類のゲームのフレームレートの数値にすり替えるのかよ
ユーザを馬鹿にしてるみたいでものすごく納得行かないんですけど…

もういっそのことExcelのGPU支援とか動画のデコードとかで比較すれば
差がゼロ%になって公式見解としてもっと効果的なんじゃないかと思う
2015/01/27(Tue) 20:17 | URL | LGA774 #-[ 編集]
146940 
アメリカで集団訴訟だろ。
ユーザーが黙ってるわけがない。
性能云々じゃなく、ユーザーを騙して買わせたわけだからな。
208bit3GBメモリって表示してたらここまで問題にならなかった。
2015/01/27(Tue) 23:01 | URL | LGA774 #-[ 編集]
146958 
え、普通はゲームのフレームレートの為に速いのを買うんじゃない
の?

あれ、気のせいか?なんか胸のあたりが痛い、、、
2015/01/28(Wed) 07:24 | URL | 木津健介 #-[ 編集]
146961 
持ってないし買う予定もなかったから970およびnVidiaに文句言う気はないけど
4gamerはわざわざGPU負荷クソ高い設定のゲーム持ち出して 「問題は事実だけどどっちにしても快適に遊べるレベルじゃない」→「ユーザーに実害はない」みたいに誘導しようとしてんのがクソ気持ち悪い
そりゃBF4の4k+DSR200%とか現実的じゃない設定ならメモリ周り関係なくplayableなFPS得られないから問題が矮小化されるよなあ
一方でskyrim+高解像度テクスチャ+MODみたいなメモリ周り酷使するタイトルも実際にあるわけだが
2015/01/28(Wed) 13:09 | URL | LGA774 #-[ 編集]
146975 
まあ公式じゃないMOD使ってのベンチは公表しにくいからね
公式ハイレゾパックだけで負荷かけられればいいんだけど
2015/01/29(Thu) 12:18 | URL | LGA774 #-[ 編集]
146979 
公式ハイレゾパックだけで3.5GB以上使うとなると必然的にSP負荷も高い設定になると思う
現実的にゲームでは数%しか下がらないほどの影響だろうね
2015/01/30(Fri) 00:50 | URL | LGA774 #-[ 編集]
146981 
あれ?性能アップさせるためメモリ割り当ての修正ドライバーが出てくることになった?
2015/01/30(Fri) 00:54 | URL | LGA774 #-[ 編集]
146986 
あ…ありのまま 今 起こった事を話すぜ!

「おれは ネットでGTX970の不具合を調べようと
思ったら 四亀以外の日本のメディアが全く報じていなかった」
(唯一報じた四亀も独自調査はせずNVIDIAの検証方法を踏襲しただけ)

な… 何を言っているのか わからねーと思うが 
おれも 何をされたのか わからなかった…

頭がどうにかなりそうだった… スポンサーへの配慮だとか緘口令だとか
そんなチャチなもんじゃあ 断じてねえ

もっと恐ろしいものの片鱗を 味わったぜ…


NVIDIAと日本のメディアってよっぽど『仲が良い』んだろうねぇ
2015/01/30(Fri) 23:34 | URL | LGA774 #-[ 編集]
147317 
これ、すげぇ実害被ってるわ。
PremiereでCUDA使うとHD4本同時ストリームですら無理。
ソフトウェア依存にすると問題ない。
明らかにGPUが原因。
ちなみにGTX980はXAVC4Kプレビュー無理。cudaコア数=cuda性能って聞いてたけどだめっぽい。
2015/03/02(Mon) 10:33 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/7926-47998124
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック