ビッグデータ:S.M.A.R.T.の統計

ホームビッグデータの復旧応用技術→壊れかけドライブと統計→S.M.A.R.T.の統計

■ S.M.A.R.T.

 Self-Monitoring, Analysis and Reporting Technologyの各頭文字から、S.M.A.R.T.と呼ばれております。 主にハードディスク(SSD)向け故障予測の指標となっております。

■ 考えている事に対して逆に働く

 いわゆる、考えている事に対して逆に働く・・、という場合が多くございます。 データ復旧サービスおよびテクニカルサポートの方でよくご相談いただきます事例A~Cをご参考ください。

[A, 正常だと思っていたら、突然の故障]

 S.M.A.R.T.自体、ほとんど動かず正常値を示していたため、正常と判断いたしました。 しかしながら翌朝、Windowsが起動せず、取り外して調べた結果、不良セクタでまともに使えない状態だった。

[B, 故障だと思っていたら、実は正常]

 S.M.A.R.T.の再配置カウント0x05が大きく動く。 危ないらしく故障と判断したいが、FromHDDtoSSDでは故障ではなく「中立」だった。 テクニカルサポートに問い合わせた結果、まだ様子見段階という事なので普通に使っていました。 それから1年たちますが、完全スキャン含めて全く問題ありません。

[C, 壊れてから故障通知 それではバックアップできません]

 S.M.A.R.T.の再配置カウント0x05が大きく動く。S.M.A.R.T.も使えるじゃんと思い、バックアップを開始いたしました。 しかしながら、すぐに異音が出始めまして、まともにコピー(バックアップ)できません……。 つまり、壊れてからの故障通知だったようです。結局、まともに動かないため、データは諦めました……。 色々な属性(3番参照)はあるのですが……、実際には「見せているだけ」の属性が多い(動かないため)のです。

■ S.M.A.R.T.の統計と、先ほどの事例A~Cを比較 どこに分類されやすいか

 ドライブの故障に関する統計についてまとめた結果、500GB以下の場合は事例A、それ以上の場合は事例Bまたは事例Cの場合が多い傾向です。 最近の大容量では、特に事例Cが問題となりやすい(データを失う)ゆえ、S.M.A.R.T.は参考程度に留め、バックアップを重視してください。

 Cの場合、明らかにプラッタ歪み(ビット腐敗)が絡んでおりますので、 ドライブへのアクセスが重いなどの前兆が必ずあったはずです。 しかしながら、それをS.M.A.R.T.の正常指標により見逃してしまった可能性が高いとみております。

 使い方を工夫すれば、S.M.A.R.T.も問題ない事が分かってきました。使い方次第です。 >> S.M.A.R.T.の動きについて

■ S.M.A.R.T.の故障統計について

 ドライブ1台より出されるS.M.A.R.T.値自体を眺めていても、突破口は見つかりません(これは断言できます)。 このような場合は、同型または同類ドライブの値と比較したり、または解析したりする必要性が出てきます。 そこで、S.M.A.R.T.ビューを拡張いたしましたS.M.A.R.T.コンセンサスを搭載いたしました。 この機能は多数の故障予測データを自動的に送受信いたしまして、さらに解析まで自動的に実施いたします。 S.M.A.R.T.単独からの判断ではなく、多方面から意見を取り入れ、最終判断を下しますので、不良セクタなどの早期発見につながります。

 「流れ」をいかに正しく判断できるか、これが「誤判定」を防ぐ突破口でした。