ストレージのメモ(信頼性の指標)

Wikipediaより
基礎知識(IT系)

先週に引き続き、福田昭のストレージ通信(EE Times Japan)で、ストレージの基礎を勉強中。

信頼性に関する用語の整理

バスタブ曲線(故障率曲線)

「福田昭のストレージ通信(EE Times Japan)」の非会員閲覧可能ページより

HDD(数多くの部品で構成されるシステム)の故障率は、バスタブ曲線(故障率曲線)にしたがうとされる。製造直後の初期故障期と、構成部品が劣化したあとの摩耗故障期のあいだの期間「偶発故障期」が製品の仕様としての耐用年数であり、この期間の故障率にマージンを加えたものが「製品仕様としての故障率」になる。

Wikipediaの説明 (参考)

故障率曲線(こしょうりつきょくせん)とは、機械や装置の時間経過tに伴う故障率y (t) の変化を表示した曲線のこと。その形からバスタブ曲線と呼ばれて、時間の経過により初期故障期、偶発故障期、摩耗故障期の3つに分けられる。

時間経過に伴う故障率の変化から、次の3つに分類される。

  • 故障率減少型 (Decreasing Failure Rate : DFR)
    時間の経過とともに故障率が減少していくもの。主に製造上の欠陥による故障。
  • 故障率一定型 (Constant Failure Rate : CFR)
    故障が時間の経過に関連のないもの。主に突発的事象による故障。
  • 故障率増加型 (Increasing Failure Rate : IFR)
    故障が時間の経過とともに増加していくもの。主に磨耗、損耗など特定の不良モードによる故障。

信頼性の指標(MTBF, MTTF, AFR)

HDDの信頼性(=バスタブ曲線の「偶発故障期」における故障確率)をあらわす指標として、MTBF (Mean Time Between Failue:平均故障間隔)、MTTF (Mean Time To Failue:平均故障時間)、AFR (Annualized Failure Rate:年間故障率 )がある。MTBFとMTTFの違いは、MTBFが「故障した部品(ストレージ)」を修理して再び稼働させることを前提とした指標であるのに対して、MTTFは修理することなく交換することを前提とした指標である(参考:ドスパラのサイト)。

!MTBFとMTTFは寿命ではなく、故障確率を時間単位で表したもの!

MTBFを使った計算例

故障せずにすむ確率は

故障せずにすむ確率=exp (-t / MTBF)  ここで、t=時間

で計算できるので、MTBFが100万時間(≒114年)の製品の場合、約114年後に生き残っているのは約37%となる。逆にいえば、114年後には63%が故障している。

AFR

多数のHDDを消費する汎用大型コンピュータではMTBFやMTTFは有効な指標だが、使用台数が少ない個人ユーザには適さないので、代わりにAFRを使う。AFRは稼働時間に依存する指標である。

AFR=1- exp (一年間稼働時間/MTBF)

MTBFAFR(年間フル稼働の場合)
200万時間0.44%
150万時間0.58%
100万時間0.87%
50万時間1.74%