【データ復旧】
DIERCTSCAN / 並列同時解析 / AIデータスキャン

  • 2011年
    2.0TBを超える大容量HDDやRAID構成。サーバ環境に対応した「並列同時解析」技術を確立。
  • 2016年
    AIによるデータスキャン作業に成功し従来の手動による工程を自動化へと移行。
  • 2024年
    AI技術をさらに発展させデータ再構築作業への応用に成功。より深刻な障害にも対応。
  • 2025年
    AIによる推論技術を活用した次世代データ復旧ネットワークの開設を予定。

各過程の依存具合を調査のち継承関係を調査する目的でまとめた制御を可能とする”DIRECTSCAN Ver1.x”,”DIRECTSCAN Ver2.0″, “DIRECTSCAN Ver3.0″を開発いたしました。



このDIRECTSCANおよび必要とされていた細かい作業を並列化および同時処理できるように改良いたしまして従来では厳しい”重なり合った障害”を見抜いた上で速度と精度を高めた”並列同時解析”の完成(2011年9月)に至っております。



全てを新しく1から組み直すには検証その他を含め現実的ではありません。現状にて上手く動作しているコードをなるべく流用し上手く組み立てていく方法を優先いたしました。

それでも開発に1年・それから1年近い検証期間を必要といたしております。お時間を最も必要といたしましてなおかつ復旧精度を決めるデータスキャン作業がございます。

この作業ではデータを構成するセクタイメージの取得に力を入れており必要不可欠な作業です。旧技術ではこの部分の処理に関しましては1から10まで指示を出す必要があります。

これがハードディスク容量上昇と同時にコストアップへと繋がってしまいます。新技術ではこの部分を大幅に改善いたしまして今まで蓄積してまいりました技術ノウハウを全て注ぎ込み大部分の自動化に成功いたしました。

またこの先の新しい媒体に関しましては派生する等で対応可能になるよう設計いたしました。ドライブの構造が変わらない限りDIRECTSCANを改良しこの先も対応可能な見込みです。

大容量ハードディスクにて作業時間の大幅増加が懸念されるデータスキャン作業および再構築作業がございます。そのまま従来通りの技術では容量に比例して時間が上昇してしまう点をご案内いたしました。ではその点を改善するため以下のような仕組みを図りました。



左側の灰色ボックス内がカプセル化です。DIRECTSCANと名付けまして昔からの弊社パートナーさんにも配布いたしております。各種アルゴリズムの動作および連携はこのボックス内部で全て処理されます。外部からは何も意識する必要性がなく作業ミスなどもありません。

[初期診断作業]
1 最短時間にて負担がないよう診断を実施いたします。
2 スキャンが通常(レベル1~2、クラスタ)レベルで可能か判断いたします。
3 2の過程で不可判定の場合は別の手法(セクタ単位レベル)を試します。
4 3の過程で不可判定の場合はクリーンルーム作業を検討します。

1番の段階であっても危険と判断できる場合にはクリーンルームの作業検討となります。このようにデータ復旧作業では例外的な処理が多く臨機応変に対応する必要性がございます。2番・3番に関しましては、独自ソフトウェアにて素早く実施いたしております。

初期診断作業に関しましては、従来と同様の技術・手順を改良いたしております。2番・3番に関しましてDIRECTSCAN / 並列同時解析 の「初期診断アルゴリズム」に置き換わった形です。これだけでも一度に処理できるため確実かつ短時間で診断を完了できます。

1 [少しでも最良な条件を作る]:
HDD/SSDに付着するホコリをできる限り除去します。
2 [表面検査]:
トップカバーの開封に着手しプラッタ表面の状態を検査します。
3 [破損個所回収]:
正常動作を阻害する直接的な要因を全て取り除きます。(例:吸着したヘッド等)
4 [剥離した磁性体除去]:
内部の汚れている個所(削られた磁性体)を除去しそれらを回収します。
5 [内部部品交換]:
破損した部品を全て取り除き正常品から取り外したものと交換します。
6 [最終チェック]:
全部品を再確認いたします。確認のちトップカバーを閉じで作業完了です。
7 [ファームウェア修復]:
状況によってはファームウェア系統の修復を実施します。

物理障害重度の場合はクリーンルーム作業を実施いたします。

ここからがDIRECTSCAN / 並列同時解析 カプセル化(まとめられた技術)の本領発揮です。

今までは別々だったスキャンや各作業が一つにまとめられ、自動的に最適なスキャンが次々と行われる仕組みです。DIRECTSCAN / 並列同時解析 による効率的な作業は着実な復旧作業に結びつき、多数の成果を上げております。



スキャン系統の開発で沢山の技術的な要素から故障予測に活用できる部分を選別いたしました。



この自動化による試みも、もっとベースに近い部分すなわちドライブの状態を「規則的」に制御できないと動きに統一性が出てきません。統一性がないと毎回毎回状態を計算する必要が出てしまいデータが重なるほど遅くなりました。いわゆる思考ロジックを生むためのベース技術が新たに必要となる見込みになります。

これで規則に沿って自動化への思考ロジックを与えていく必要があると判断できました。このためこの並列同時解析であってもやり直し区間の再試行が増加してしまい複雑に故障した場所についてはさらに細分化した仕組みでしっかりと取り組む必要性が出てきました。