

データ復旧サービス データの形状のAI解析
まず、ドライブの空き容量にご注目ください。
通常、ドライブの容量を完全に使い切る方はほとんどいません。
かなり多くのデータを保存している場合でも、全体の2割程度は空き容量として残っていることが多いです。
つまり、ドライブ内部のすべての領域が使われているわけではありません。
実際には、データが存在しない空き領域も多く含まれています。
正常なドライブであれば、このことは特に問題になりません。
しかし、データ復旧では事情が大きく変わります。
復旧対象となるドライブは、すでに故障しかけている場合があります。
そのため、あとどれくらい正常な状態を保てるのか、正確にはわかりません。
このような状況では、必要のないアクセスをできる限り減らすことが重要です。
そのためには、どこに有効なデータが存在しているのかを、事前に把握する必要があります。
まず優先するのは、ファイルシステムのメタ情報の解析です。
メタ情報には、ファイル名やファイルの配置情報、断片化の情報などが含まれています。
しかし、メタ情報だけでは十分ではありません。
なぜなら、メタ情報そのものに実データが保存されているわけではないためです。
実際のデータは、メタ情報が示す先の領域にアクセスして取得する必要があります。
さらに、これはメタ情報が正常に取得できた場合の話です。
もしメタ情報に欠損がある場合、その欠けた部分は別の方法で補わなければなりません。
そこで大きな役割を果たすのが、データの形状のAI解析です。
復旧作業を重ねる中で、似た種類のデータは、ドライブ内でも似た配置や傾向を持つことがあると感じていました。
その傾向を実際に解析し、整理していくと、データ配置には一定の順序や規則性のようなものが見えてきます。
この情報を活用することで、データが存在しない可能性が高い領域を避けながら、有効なデータが存在する可能性の高い領域を優先して読み出すことができます。
これにより、不要なアクセスを減らし、壊れかけた復旧対象ドライブへの負担を抑えながら、必要な情報を効率的に取り出すことが可能になります。
当サービスでは、メタ情報の解析に加え、データの形状や配置傾向をAIで解析することで、復旧対象ドライブをできるだけ守りながら、より効率的なデータ回収を目指しています。
大容量ドライブの状態は変わりやすいため適切な処置の有無が成功可否を分けます。
この性質上ファイルシステム等の手掛かりからファイルの優先順位を解析しそれを元にスキャンを組み込む技術が必要となりました。それを実現するのが「ファイルシステムの形状」から解析する頻度あいまい検索(弊社独自開発)です。
ファイルシステムの形状?
ファイルシステムは使い方によって「形状」ができます。
なぜなら同じような場所に似たサイズを入れていくと同じアルゴリズムで作用するゆえに、格納状況に関する「形状」が似てきます。お客様が希望されるファイル位置の推測がしやすくなります。
「ドライブが正常」ならば、ファイルの位置については「インデックス」から取得します。しかし正常ではないドライブは出来る限りアクセスの手数を減らしたい(ドライブ悪化を防ぎます)ために、インデックスからの取得は行いません。
純粋に「形状」と「ファイルの実部」から素早く復旧する手法が最善です。さらにこの「インデックス」の区間はアクセス頻度が普段から高いためにドライブを悪化させる「不良セクタ」が多いのです。「インデックス」がなくても復旧できるのなら、アクセスしないのが一番です。
頻度あいまい検索
この検索結果に別の調査結果(ビット腐敗等)およびご指定データ(デジカメなど)等を入れますと「ファイルの集まり方」等の「最小限の情報」で確信の持てるファイルの優先順位が得られます。
この「最小限の情報」というのが大事で壊れかけドライブは調査すらも「壊れるリスク」が発生いたしますので調査は最小限に済ませ、データを取り出しに行くアルゴリズムがとても利用価値の高いものになってきております。
ファイル名高速検索機能に付属の「頻度あいまい検索」です。

弊社では暗号開発の他にデータ復旧技術・ソフトウェアの自社開発・研究を行っております。
※ 沿革ならびにこちらにまとめております。
