S.M.A.R.T.について:古いドライブですが、個別調査を行っております。※ 現在はビッグデータで処理しております。

ホームドライブ解析技術→バックアップの危険性→S.M.A.R.T.について

■ S.M.A.R.T.による「ストレージ故障通知」の検証です。
「ドライブの故障を通知」する機能として、利用できるかどうか? S.M.A.R.T.が警告された以下の状況から、四つのテストを実施して、その後の状況をみていくという実験です。まずは、型番およびBAD通知のときの状況です。

  • [HDD 160GB] 4R160L0:ファイルのコピーに失敗して、再起動した。その後、BADになった。
  • [HDD 40GB] MK4025GAS:突然、BADになった。微かに作動音が大きくなったような気がするが、特に問題ない。
  • [HDD 60GB] MK6025GAS:OSの立ち上げに失敗後、BADになった。セーフモードは起動できる。
  • [HDD 40GB] MK4020GLS:時々、OSの立ち上げに失敗するようになる。その頃からBADの表示が出始める。
  • [HDD 160GB] SP1614N:いきなりBADになった。動作は不安定です。
  • [HDD 120GB] ST3120023AS:データ保管用として利用していた。一部読み出せなくなり、BADになった。
  • [HDD 2000GB] WD20EARS:データ保管用として利用していた。「ディレクトリが壊れています」で読み出せなくなり、BADになった。
  • [HDD 3000GB] ST3000DM001:BADが出て、突然、全データが見えなくなった。
  • [SSD 275GB] CT275MX300SSD1:OSが起動不能になった。別のパソコンで、S.M.A.R.T.のBAD警告と、大量の不良セクタを確認いたしました。

○ 第一テスト 全セクタ 00h上書き/全セクタリード/ランダムアクセス

 全セクタに00hを上書きして、各セクタの回復(不良セクタの修復)を試みます。 不良セクタ回復処置後「全セクタリード」および「ランダムアクセス」のテストを実施いたします。 全セクタリードについては「シーケンシャル」を採用いたしまして「ランダム」と差別化します。 ランダムについては、無作為に選ばれた「一部分」です。 速度は考慮せず、読み書き不能セクタにならない場合はPass、それ以外はErrorとします。 全セクタリードがErrorとなった場合、ランダムは行いません。 一度に全て調べようとするとキリがないので、甘い基準から少しずつ締め上げていきます。

HDD00h上書き全セクタリードランダム
4R160L0PassPassError
MK4025GASPassPassPass
MK6025GASPassError--
MK4020GLSPassPassPass
SP1614NErrorError--
ST3120023ASPassPassError
WD20EARSPassPassPass
ST3000DM001PassErrorError
CT275MX300SSD1PassPassPass

 SP1614Nに関しては、もはや手の施しようがありません。 さらに、この状態からではバックアップすら難しいです。よって、第一テストで終了となります。

 SSDについては、非常に、不良セクタの修復がやりやすいです。どこのメーカさんでも、修復できる可能性が8割以上もある、特殊な状況下です。 不良セクタ程度のことで、わざわざ買い替えるのはもったいないです。修復して再利用しましょう。[>> データ復旧クラウドソフトウェア 不良セクタ修復・レストレーション]

○ 第二テスト 4時間連続の全セクタ 00h上書き/全セクタリード及びランダムアクセス

◇ 4時間連続運転させ(ランダムアクセスは除く)、様子を伺います。

HDD00h上書き全セクタリードランダム
4R160L0PassError--
MK4025GASPassPassPass
MK6025GASPassError--
MK4020GLSPassPassPass
ST3120023ASErrorError--
WD20EARSPassPassPass
ST3000DM001ErrorErrorError
CT275MX300SSD1PassPassPass

 ST3120023ASについては、この地点で再起不能が確定です。 4時間あればバックアップは大丈夫だと思いますが、 このS.M.A.R.T.を無視した場合、手遅れになると判断できます。 ただし、第一テストでランダムがErrorとなりましたので、一筋縄でのバックアップは、難しい状況です。それゆえ、第二テストで終了となります。

 ST3000DM001は、噂のDMシリーズです。一度、状態が崩れると、そう簡単には元には戻りません。 予測通り、ここで動作不能となって、脱落となります。容量が大きいため、4時間でバックアップは、きついですね……。

○ 第三テスト 24時間連続の全セクタ 00h上書き/全セクタリード及びランダムアクセス

 24時間連続運転させ(ランダムアクセスは除く)、様子を伺います。

HDD00h上書き全セクタリードランダム
4R160L0ErrorError--
MK4025GASErrorError--
MK6025GASPassError--
MK4020GLSPassPassPass
WD20EARSPassPassPass
CT275MX300SSD1PassPassPass

 元気だったMK4025GASの突然死です。破損個所が「モータ」だったようで、突然の回転停止により、再起不能になりました。 4R160L0も、この地点で動かなくなりました。

 SSD(CT275MX300SSD1)は、何の問題もなく、とても元気が良いですね。不良セクタが出ても、それらを修復して、普通に使えることが多い点に納得です。

○ 最終テスト 速度を考慮した00h上書き / シーケンシャル / ランダムアクセス

 速度を考慮した00h上書き/シーケンシャル/ランダムアクセスを行います。 エラー訂正などで著しく能力が低下した場合、Errorとなります。 ただし、読み書き不能セクタなどで一部分のみ破損している場合はPassとする。

HDD00h上書き全セクタリードランダム
MK6025GASErrorError--
MK4020GLSPassPassPass
WD20EARSPassPassPass
CT275MX300SSD1PassPassPass

 MK6025GASの書き込み速度は不安定で、読み込みの一部分がエラーとなっている原因はヘッド・プラッタ両方にある可能性が高く、 もう再起させる事はできないと判断できます。MK4020GLSは依然として元気ですね。

 意外なことに、WD20EARSが、ここまできても全く問題ありません。高密度プラッタでも、軽微な磁性体の異常なら、修復してから再利用が可能な点を、ここで証明いたしました。 現在、8.0TBが主流になりつつあります。この高密度なドライブでも、読み込み不能程度の軽い不良セクタなら、修復して活用できると思います。 大量に8.0TB以上のドライブを稼働さてて、自然に読み込み不能セクタが出現するタイミングを待っている状態です。出てきたら、すぐに研究いたします。

■ 結論

 S.M.A.R.T.は故障後の通知にのみ利用可能です。 ただし、S.M.A.R.T.が警告を出す前に、あのような突発破損を起こす例はとても多く、日頃のバックアップを重要にした方が、遥かに有意義です。
例えば、今回のMK4025GASは運良くS.M.A.R.T.警告の方がデータが読めなくなるより「先」だった、ただ、それだけの事です。 また、徐々な劣化については、ある程度の測定が可能ですが、突発的なヘッドクラッシュなどには対応できません。 あと、今回用意したドライブは「自然故障」に分類されます。

■ S.M.A.R.T.ドライブ故障通知

自動的にドライブの故障を通知する「S.M.A.R.T.故障通知ソフトウェア」を開発いたしました。 基本的な予測を実装済のフリーエディションから、少し踏み入ったサポートエディションを揃えております。 テクニカルサポート付きですので、お気軽にご利用いただけたら幸いです。

S.M.A.R.T.ビュー 故障予測設定