S.M.A.R.T.による故障予測技術の開発

ホームデータ復旧サービス→ S.M.A.R.T.故障予測機能の開発

■ まず、デフラグについて

デフラグは、現在のドライブに必要ありません。
SSDについては原理的に不要です。フラッシュの寿命を縮めるだけです。
ハードディスクについても、NCQなどのアクセス最適化が「ハードウェア」レベルで実装されており、
ばらばらな位置にファイルが存在しても、ハードウェアレベルで最適化処理されます。
その仕組みから、ヘッドの寿命を縮めるだけです。

S.M.A.R.T.による制御について

○ S.M.A.R.T.の利用

自己診断機能“S.M.A.R.T.”(Self-Monitoring Analysis and Reporting Technology)をドライブから取得して、 その変化を計算することにより、事前に故障を「予測すること」が、できるとされております。 しかし、肝心のデータがしっかり動かないため、これだけで「予測する」となると、非常に困難でした。 これでは予測ではなく「通知」の域を出ません。


そこで、S.M.A.R.T.単独では厳しい予測を、 「複数の調査結果」と組み合わせる事により、通知から「予測」にする試みを10年以上、行ってきました。 その結果、完全スキャンとの組み合わせや、ビッグデータ解析を経て、 それらをすべて自動化する「ブロックチェーン」に、それら機能をすべて移植して、予測を試みております。
※ ブロックチェーンには、S.M.A.R.T.というシンボル名のNFTに、この全機能を搭載してマッピングいたします。

〇 ご利用の環境に合わせ「二通り」の故障予測をご提供

ストレージ故障予測系: スキャンを組み合わせ、故障を予測。24時間継続のサーバ系に最適です。

S.M.A.R.T.数値変動グラフ:数日分(約7日)の変動を記録しております。

1, グラフ内部をクリックすると、現在値、データに関しまして、その表示を切り替えることができます。
2, スキャンA、スキャンB、解析結果(左下グラフ):独自の故障予測スキャンの結果を表示しております。
3, 中央にある緑の線が中央に安定すれば正常、上下に振れてブルーゾーンを超えると、異常判定になります。
4, 状態範囲の「レッドゾーン」に入った場合は、ドライブ換装をお勧めいたします。
5, 再描写:各グラフを再描写します。
6, 再解析:故障予測の演算部に再解析を促すキューを投げます。

S.M.A.R.T.では処理できないエラー・故障が多数、存在することが判明いたしました。
そこで、各ドライブが確実に状況を出さなければならないコマンドで予測する方式を独自に開発いたしました。
これを「故障予測スキャン」と名付けました。

技術パートナー様および、この試みに賛同いただいたユーザ様のご協力について、深く感謝いたします。
その故障個所・不良セクタの種類・不良セクタの分布・故障発生前後の状況など、 壊れやすい状況・アクション・内容を整理したうえ、ソフトウェアにいたしました。

S.M.A.R.T.コンセンサス系: 低負荷でしっかりその都度、予測できます。普段のご利用に最適です。

ビッグデータを利用して、ドライブの故障予測を実施いたします。 S.M.A.R.T.およびビッグデータ以外に別の検査が必要な場合は、それを追加検査して総合判断いたします。 ストレージ故障予測では、常駐的なスキャンを必要としますので、常に常駐させる必要があります。しかし、こちらは常駐不要です。 負荷も軽いゆえ、普段のご利用には、こちらの機能をご活用ください。

◇ S.M.A.R.T.の状態変化については、以下に従います。 ドライブの状態により、その判定が「180度異なる」ため、これがS.M.A.R.T.の難点です。 S.M.A.R.T.が動きましてバックアップを指示されても、すでに手遅れな場合が多いのはこのためです。

○ S.M.A.R.T.による予測の典型的な失敗例

S.M.A.R.T.では見抜けない物理障害をご紹介いたします。 データを損失しますので、注意が必要となります。現在の3.0TB級ドライブでもよく拝見しております。

□ S.M.A.R.T.の取得:通常の読み書きとは「別」に存在するデータとなります。

数字が並んでおりますが、あまり気にしないでください。
この場合、一般的なS.M.A.R.T.予測ソフトウェアでは、間違いなく良好を示します。 さて、この「良好」は本当でしょうか。
そこで、このドライブにアクセスいたしまして、実際に、データを読み出してみましょう。

□ Windowsより読み取ろうとした結果、エラーが発生いたします。

エラーが発生いたしました。データへのアクセス失敗です。 このようなエラーについては、ソフトウェア的な破損ではなく、物理的な破損の方が遥かに多いです。 FATやMFTが、読み書き不能セクタで壊れた場合は、物理的なエラーで読めないという流れになります。 これらは、症状が断定できないうえ、このエラーをすぐに「論理障害」と決め付けてはいけません。

□ ここでFromHDDtoSSDの「完全スキャン」を実行いたします。
これは「ハードディスク/SSD」に対しまして、セクタレベル(最小単位)の完全検査を行うことができます。

上側のグリーンについては、検査して良好だった点を示しております。
しかし、これはあくまでも「不良セクタがない」事を示しているのみとなります。
「検査系ソフトウェア」で、調査できるのはここまでです。 しかし、これでは全くの不十分です。
下部の「動作安定度」の指標が非常に乱れております。
こちらは、グラフが「一直線」になれば正常で、大きく乱れた場合は動作系統に異常があります。
このドライブは、物理的に壊れておりまして、修理はできません。なおさら、論理障害ではありません。


バックアップは、読み出せるかどうか時々でも良いのでご確認ください。
実は、そのバックアップ先が機能していなかったという場合を、多くうかがいました。
ドライブは、「書き込み側」よりも「読み込み側」が壊れやすい性質となっております。
そのため、書き込み専門となってしまったバックアップ先については、書き込めていないのに、正常の通知が出てしまいます。
これが要因で、「読み込み側」が壊れても即時にエラーを出すこともなく、曖昧に動作し続けてしまいます。
読み込ませて、エラーのセクタが検出され、そこではじめて、「エラー」が返されます。
それまでは正常な動作をふるまいます。
これが理由で、書き込める状態でも「読み込める」とは限りません。
これが……、「バックアップ損失」の、主な原因となります。

>> 詳しくは、こちら (自動バックアップや、ミラーリングの過信は厳禁)

◇ アクセス [ベスト5]