【データ復旧】
DIERCTSCAN / 並列同時解析 / AIデータスキャン

  • 2011年:2.0TBを超える大容量HDDやRAID構成、
    サーバ環境に対応した「並列同時解析」技術を確立。
  • 2016年:AIによるデータスキャン作業に成功し、
    従来の手動による工程を自動化へと移行。
  • 2024年:AI技術をさらに発展させ、データ再構築作業への応用に成功。
    より深刻な障害にも対応可能となる。
  • 2025年:AIによる推論技術を活用した、次世代データ復旧ネットワークの開設を予定。

各過程の依存具合を調査のち、継承関係を調査する目的で、
まとめた制御を可能とする
“DIRECTSCAN Ver1.x”,”DIRECTSCAN Ver2.0″, “DIRECTSCAN Ver3.0″を開発いたしました。



このDIRECTSCANおよび必要とされていた、
細かい作業を並列化および同時処理できるように改良いたしまして、
従来では厳しい”重なり合った障害”を見抜いた上で速度と精度を高めた
“並列同時解析”の完成(2011年9月)に至っております。



HGST製 2000GB(2.0TB)のハードディスクです。
このレベルのディスクが普及(2012年現在)し始めており、
データ復旧に関しましても需要の増加が見込まれます。

全てを新しく1から組み直すには、検証その他を含め、現実的ではありません。
現状にて上手く動作しているコードをなるべく流用し、
上手く組み立てていく方法を優先いたしました。
それでも開発に1年、それから1年近い検証期間を必要といたしております。
お時間を最も必要といたしまして、なおかつ復旧精度を決めるデータスキャン作業がございます。

この作業では、データを構成するセクタイメージの取得に力を入れており、必要不可欠な作業です。
旧技術では、この部分の処理に関しましては、1から10まで指示を出す必要があります。

これがハードディスク容量上昇と同時にコストアップへと繋がってしまいます。
新技術では、この部分を大幅に改善いたしまして、
今まで蓄積してまいりました技術ノウハウを全て注ぎ込み、大部分の自動化に成功いたしました。

また、この先の新しい媒体に関しましては、派生する等で対応可能になるよう設計いたしました。
ドライブの構造が変わらない限り、DIRECTSCANを改良しこの先も対応可能な見込みです。

大容量ハードディスクにて、
作業時間の大幅増加が懸念されるデータスキャン作業および再構築作業がございます。
そのまま従来通りの技術では、容量に比例して時間が上昇してしまう点をご案内いたしました。
では、その点を改善するため、以下のような仕組みを図りました。



左側の灰色ボックス内がカプセル化です。
DIRECTSCANと名付けまして、昔からの弊社パートナーさんにも配布いたしております。
各種アルゴリズムの動作および連携は、このボックス内部で全て処理されます。
外部からは何も意識する必要性がなく、作業ミスなどもありません。

[初期診断作業]
1 最短時間にて負担がないよう診断を実施いたします。
2 スキャンが通常(レベル1~2、クラスタ)レベルで可能か判断いたします。
3 2の過程で不可判定の場合、別の手法(セクタ単位レベル)を試します。
4 3の過程で不可判定の場合、クリーンルーム作業を検討します。

1番の段階であっても、危険と判断できる場合には、クリーンルームの作業検討となります。
このようにデータ復旧作業では例外的な処理が多く、臨機応変に対応する必要性がございます。
2番・3番に関しましては、独自ソフトウェアにて素早く実施いたしております。

初期診断作業に関しましては、従来と同様の技術・手順を改良いたしております。
2番・3番に関しましてDIRECTSCAN / 並列同時解析 の「初期診断アルゴリズム」に置き換わった形です。
これだけでも一度に処理できるため、確実かつ短時間で診断を完了できます。

1 [少しでも最良な条件を作る]:
HDD/SSDに付着するホコリをできる限り除去します。
2 [表面検査]:
トップカバーの開封に着手しプラッタ表面の状態を検査します。
3 [破損個所回収]:
正常動作を阻害する直接的な要因を全て取り除きます。(例:吸着したヘッド等)
4 [剥離した磁性体除去]:
内部の汚れている個所(削られた磁性体)を除去しそれらを回収します。
5 [内部部品交換]:
破損した部品を全て取り除き正常品から取り外したものと交換します。
6 [最終チェック]:
全部品を再確認いたします。確認のちトップカバーを閉じで作業完了です。
7 [ファームウェア修復]:
状況によってはファームウェア系統の修復を実施します。

物理障害重度の場合、クリーンルーム作業を実施いたします。

ここからがDIRECTSCAN / 並列同時解析 カプセル化(まとめられた技術)の本領発揮です。

今までは別々だったスキャンや各作業が一つにまとめられ、
自動的に最適なスキャンが次々と行われる仕組みです。
DIRECTSCAN / 並列同時解析 による効率的な作業は着実な復旧作業に結びつき、
多数の成果を上げております。



冒頭で説明いたしました通り、データ復旧技術の開発中には必ず「副産物」が出来ます。

特にスキャン系統の開発で沢山の技術的な副産物ができておりまして、
故障予測に活用できる部分を選別いたしました。
S.M.A.R.T.予測とは全く異なる、
新しい原理で動作いたしますので、お試しいただけたら幸いです。



この自動化による試みも、もっとベースに近い部分、
すなわちドライブの状態を「規則的」に制御できないと動きに統一性が出てきません。
統一性がないと、毎回毎回状態を計算する必要が出てしまいデータが重なるほど遅くなりました。
いわゆる、思考ロジックを生むためのベース技術が新たに必要となる見込みになります。

これで、規則に沿って自動化への思考ロジックを与えていく必要があると判断できました。
このためこの並列同時解析であってもやり直し区間の再試行が増加してしまい、
複雑に故障した場所についてはさらに細分化した仕組みで、
しっかりと取り組む必要性が出てきました。