北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
SSD reliability in the real world: Google's experience(ZDNet)
High-end SLC SSDs No More Reliable than MLC SSDs: Google Study(techPowerUp!)

トロント大学よりSSDの信頼性に関する論文が発表され、この中でいくつか興味深い事柄が明らかになっています。

研究は6年間にわたり百万以上のSSDのデータ信頼性を検証したもので、10種類の異なるモデルのSSDが用いられ、それらのSSDに使用されるNAND flashのタイプはSLC, MLC, eMLCの3種類、またエンタープライズ向けとコンシューマ向けが使用された模様です。

そして導き出された結論が以下となります。
 
  • Uncorrectable Bit Error Rate (UBER) のスペックは意味のある数字ではなく、無視して良い。
  • SSDを使用し続けることによるRaw Bit Error Rate (RBER) は予想よりも低く、UBERやその他のエラーとは関連がない。
  • ハイエンドSLCドライブはMLCドライブよりも信頼性が高いというわけではない
  • SSDの故障はディスク(おそらくはHDDのことだろう)よりも低いが、UBERが生じる率は高い。
  • SSDは使用することよりも(製造されてからの)年数の方が信頼性に影響を及ぼす
  • 新しいSSDにBad Blockは普遍的に見られ、多数のバッドブロックを有するSSDはその他の数百のブロックを失っている。おもにこれはダイまたはチップのエラーによる。
  • 30~80%のSSDは最低1つのバッドブロックが生成されており、2~7%は最初の4年間に最低1つのバッドチップが出来上がる。

SLC SSDがMLC SSDより必ずしも信頼性が高いわけではない、というのは驚きの結果ですが、その理由として、エンタープライズ向けのSSDはそもそもがとてつもなくover-provisioningであるからとしています。つまり必要以上に信頼性確保のために冗長性を確保しすぎており、もはや意味のない領域に達してしまっているということでしょう。

この論文が2番目に強調しているのはSSDのエラー増加に関連するのは使用ではなく年数だとしていることです。前述のover-provisioningによりFlashの摩耗を恐れる必要はなく、研究の中で書き込み上限に達したドライブはなかったようです。

ただ一方で、UBER(訂正不可能な誤りの発生率 と日本語訳されている)はSSDの方が高いと結論づけられており、SSDのデータのバックアップはディスク(=HDDという解釈で良いだろう)のそれよりも重要だと述べています。SSDそのものが故障して使えなくなることはそうそうないが、それよりもデータが壊れることはあるという一文で締めくくられています。

とすると、ブートや一時的なデータ置き場にSSD、倉庫としてHDDを使用するのは理にかなった構成になりそうです。まあ、自作ユーザーにはSSDのデータが壊れる前に買換えてしまう方も多そうですが。自作PCの場合は電源の故障やらOSやソフトウェアのエラーを心配した方がいいかもしれません。さらにいえば最もアカンのはPCを使う人間と言うことになりそうです(組んでる途中にSATAコネクタへし折ったとか、静電気で逝っちゃったとか・・・。しかしこればかりはどうにもならない)。



PCパーツの通販は・・・
ソフマップicon 1's TSUKUMO ネットショップ ドスパラ パソコン工房

コメント
この記事へのコメント
151552 
大学の研究グループが行ったのだろうけど、6年間って長い。
博士課程の学生が6年間費やして発表したんだったら凄いな。
それにしてもMLCの発展はすばらしい。ハイエンドSLCと遜色ないとは…。
2016/03/01(Tue) 00:32 | URL | LGA774 #Lmz8sijI[ 編集]
151553 
トロント大がGoogleのデータセンターから
SSDの故障のデータをもらってきて分析したんだな

要約のせいか結論がどうにも中途半端な感じだ
HDDにせよSSDにせよ世間で使用されてる大抵のファイルシステムは
もともとバッドブロックが増える前提でデザインされてる
SSDはバッドブロックが多いとか増えるとか言われてもでっていう
2016/03/01(Tue) 01:32 | URL | LGA774 #-[ 編集]
151554 
TLCは?
2016/03/01(Tue) 10:37 | URL | LGA774 #-[ 編集]
151555 
SLC並みのTBWを可能にするためにMLCに適切なオーバープロビジョニングを設定する訳で。

それより書き込まれたまま動かされず長期放置されたブロックのデータはいつまで保持できるかっつうのは、SLCもMLCも大して変わらないんじゃないかな。
意外にもそれなりにの書き込み頻度で使うSSDの方がデータが壊れないで済むのかも知れないな。
2016/03/01(Tue) 10:52 | URL | LGA774 #-[ 編集]
151556 
>組んでる途中にSATAコネクタへし折ったとか、静電気で逝っちゃったとか・・

うん、まぁ、そうね・・・。

CPU割ったり[K6-III]、
ソケットピン曲げたり[LGA1333]ね・・・。


2016/03/01(Tue) 11:50 | URL | i7 市民 #-[ 編集]
151557 
> HDDにせよSSDにせよ世間で使用されてる大抵のファイルシステムは
もともとバッドブロックが増える前提でデザインされてる

既に存在するバッドブロックを避けて使えるようになってるだけで
ランタイムに発生した場合にも対処できるものは一般的じゃないよ
2016/03/01(Tue) 12:13 | URL | LGA774 #-[ 編集]
151558 
30-80 percent of SSDs develop at least one bad block and 2-7 percent develop at least one bad chip in the first four years of deployment.
なので、最後はバッドブロックではなくバッドチップですね。
2016/03/01(Tue) 12:31 | URL | LGA774 #tZdvIO.w[ 編集]
151560 
6年前のSSDじゃあ、プロセスが30~40nmくらいでは?

今の15/16nmのNANDには、通用しない研究結果な気が。

2016/03/01(Tue) 12:35 | URL | LGA774 #Q3pCjmGY[ 編集]
151561 
> HDDにせよSSDにせよ世間で使用されてる大抵のファイルシステムは
> もともとバッドブロックが増える前提でデザインされてる

そんなことないと思うけど。
superblock はさすがにバックアップがあるけど、ジャーナルには冗長性がなく、たまたまジャーナルがふっとぶと、ファイルシステム全体の整合性検査が必要になる方が普通でしょう。
その場合、当然失われるデータも出る。
2016/03/01(Tue) 14:38 | URL | LGA774 #qsvP4ThM[ 編集]
151568 
32GBや64GBの頃はデータがほとんど埋まった状態で残りの数十GBをいかにやりくりするかだったから
寿命に対して敏感になってたけど
現在256GB~1TBが主流になってくると
いくらTLCで寿命が三分の一になろうと
融通できる空き領域そのものが広大なため寿命そのものを気にする必要になった、そこまでは体感でも分かるけど
データが消えるのは辛いね…
かといってHDDもSMRで書き込み中停電すると256MBのデータブロックごと消滅したりして怖さがある
SDカードはほったらかしにしてるとデータが消えるかもしれないし
やはり光学メディアに行きつくのだろうか…?
2016/03/01(Tue) 22:51 | URL | LGA774 #-[ 編集]
151582 
>151554
TLCはMLCの一種とする考えもある
2016/03/02(Wed) 12:55 | URL | LGA774 #ex3yOCrA[ 編集]
151584 
ファイル単位でのミラーリングが出来るファイルシステムを使えば良いような気がする。
2016/03/02(Wed) 16:00 | URL | LGA774 #-[ 編集]
151585 
6年前てX25-Vとかいうマジキチ耐久SSDが出た年か
2016/03/02(Wed) 16:25 | URL | LGA774 #-[ 編集]
151586 
いやさすがに光学メディアに行き着く前にRAIDで落ち着くと思うぞ…
2016/03/02(Wed) 18:09 | URL | LGA774 #-[ 編集]
151588 
>151561
それでデータを喪失するのはHDDも同様だし、そうなって困るシステムの場合は
従前のHDDでもミラーリングなりパリティなりが導入されてたわけで。

だからこの話は「SSDはHDDと違って~」ということじゃなく程度問題でしかなくて、
HDDも昔の安いのはずいぶん信頼性が低かったことを思えば
多少差があるとわかったところで、今更かなと。

個人的には、SSDはバッドブロックというより丸々アクセスできなくなって
コントローラのほうに問題があったとしか思えないような壊れ方をしてるほうが気になる。
論文ではそれにも触れてくれればよかったんだけど。
2016/03/02(Wed) 19:21 | URL | LGA774 #-[ 編集]
151598 
>151588
16MB病の事だと思うけど、物理フォーマット出来れば直るだけにこれで文鎮化するとやるせないよな。
2016/03/03(Thu) 15:13 | URL | LGA774 #-[ 編集]
151605 
この研究って、現場的じゃなくて
素人の意見とたいして変わらないとこがばかばかしい。
研究しなくてもこれぐらい経験だろ。
意味なき研究するとこが大学だけどさ。
2016/03/04(Fri) 20:14 | URL | LGA774 #-[ 編集]
151606 
経験則をデータにするのが研究ですよ?
2016/03/05(Sat) 12:28 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://northwood.blog60.fc2.com/tb.php/8455-6bfba9fb
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック