S.M.A.R.T.を用いた故障予測

[HDD 160GB]
4R160L0: ファイルのコピーに失敗し再起動。その後、BADになる。
[HDD 40GB]
MK4025GAS: 突然BADになる。
運用ノイズの増加にわずかに気づくが顕著な問題はなし。
[HDD 60GB]
MK6025GAS: OSの起動に失敗しその後BADになる。セーフモードは起動可能。
[HDD 40GB]
MK4020GLS: OSの起動に時々失敗するようになる。
その頃BADの警告が現れ始める。
[HDD 160GB]
SP1614N: 突然BADになる。動作が不安定。
[HDD 120GB]
ST3120023AS: データストレージとして使用。
一部が読み取れなくなり、BADになる。
[HDD 2000GB]
WD20EARS: データストレージとして使用。
‘破損したディレクトリ’により読み取れなくなりBADになる。
[HDD 3000GB]
ST3000DM001: BADを表示し突然すべてのデータがアクセス不可能になる。
[SSD 275GB]
CT275MX300SSD1: OSが起動不可になる。
別のコンピューターでS.M.A.R.T. BADの警告と多数の不良セクタが確認される。

最初のテスト: 全セクタ00hで上書き/全セクタ読み取り/ランダムアクセス

すべてのセクタを00hで上書きし、各セクタの回復を試みます(不良セクタの修復)。不良セクタの回復処理の後「全セクタ読み取り」と「ランダムアクセス」のテストを実施します。全セクタ読み取りには「シーケンシャル」を採用して「ランダム」と区別します。ランダムはランダムに選ばれた「一部」を指します。速度を無視し、セクタが読み書き不可でなければパスとして、そうでなければエラーとしてマークします。全セクタ読み取りがエラーの場合、ランダムテストは行いません。一度にすべてをチェックしようとはせず、徐々に甘い基準を厳しくしていきます。

HDD00h 上書き全セクタ読み取りランダムアクセス
4R160L0PassPassError
MK4025GASPassPassPass
MK6025GASPassError
MK4020GLSPassPassPass
SP1614NErrorError
ST3120023ASPassPassError
WD20EARSPassPassPass
ST3000DM001PassErrorError
CT275MX300SSD1PassPassPass

SP1614Nに関しては、修復が不可能です。さらに、この状態からデータのバックアップを取ることも困難です。したがって、最初のテストで結論を出します。

SSDにおいては、不良セクタを修復することは比較的簡単です。ほとんどの場合、メーカーに関わらず、特別な状況下で成功する確率は80%以上です。

第二のテスト:連続4時間の全セクタ00hでの上書き/全セクタ読み取りとランダムアクセス

ドライブを連続4時間(ランダムアクセスを除く)稼働させ、その挙動を観察します。

HDD00h 上書き全セクタ読み取りランダムアクセス
4R160L0PassError
MK4025GASPassPassPass
MK6025GASPassError
MK4020GLSPassPassPass
ST3120023ASErrorError
WD20EARSPassPassPass
ST3000DM001ErrorErrorError
CT275MX300SSD1PassPassPass

ST3120023ASについては、この時点で回復不可能であることが確認されています。4時間のバックアップが可能かもしれませんが、このS.M.A.R.T.の警告を無視すると遅すぎる可能性があります。しかし、最初のテストでランダムテストがエラーとなったため、バックアップは困難な作業です。したがって、第二のテストで結論を出します。

ST3000DM001は一度状態が悪化すると、通常に戻すことは困難です。予測された通り、ここで操作不能になり、脱落します。大容量を考えると、4時間のバックアップは難しいです…

第三のテスト:連続24時間の全セクタ00hでの上書き/全セクタ読み取りとランダムアクセス

ドライブを連続24時間(ランダムアクセスを除く)稼働させその挙動を観察します。

HDD00h 上書き全セクタ読み取りランダムアクセス
4R160L0ErrorError
MK4025GASErrorError
MK6025GASPassError
MK4020GLSPassPassPass
WD20EARSPassPassPass
CT275MX300SSD1PassPassPass

MK4025GASは突然故障しました。損傷は「モーター」にあるようで、回転が突然停止し、回復不可能となりました。4R160L0もこの時点で機能を停止しました。SSD(CT275MX300SSD1)は非常に良好で、問題はありません。不良セクタが発生しても、多くの場合、修復して通常使用できることが確認されました。

最終テスト:速度を考慮した00hの上書き/シーケンシャル/ランダムアクセス

速度を考慮した00hでの上書き/シーケンシャル/ランダムアクセスを実施します。エラー訂正によりパフォーマンスが大幅に低下した場合、エラーとしてマークされます。しかし、読み書き不可能なセクタにより一部が損傷した場合のみ、パスとして考慮されます。

HDD00h 上書き全セクタ読み取りランダムアクセス
MK6025GASErrorError
MK4020GLSPassPassPass
WD20EARSPassPassPass
CT275MX300SSD1PassPassPass

MK6025GASは書き込み速度が不安定で、一部の読み取りがエラーとなっていることから、ヘッドとプラッタの両方に問題があると思われ回復不可能です。MK4020GLSはまだ良好です。驚くべきことに、WD20EARSはこの時点まで問題がありません。高密度プラッタであっても、ここで証明されているように、小さな磁気の不規則性は修復して再利用することが可能です。現在、8.0TBドライブが主流になっています。これらの高密度ドライブでも読み取れない小さな不良セクタがあっても修復し利用することができると考えています。

S.M.A.R.T. ドライブ故障通知

私たちは、ドライブ故障を自動的に通知する「S.M.A.R.T. 故障通知ソフトウェア」を開発しました。基本的な予測実装を備えた無料版と、より詳細なサポート版を提供しています。技術サポートも付いているので、お気軽にご利用ください。