■ [並列処理&サーバ環境復元]
RAIDのデータ復旧:ディスクを個別に「並列制御」したうえ、RAIDイメージから復旧する作業を実現
RAIDサーバ(RAID-NAS等含む)に関しましては、企業様向けサーバからTeraStationまで、多岐に渡ります。
一般的に、2台以上のドライブを分散またはミラーさせ、故障に備えるシステムとして販売されております。
しかし、リビルドに失敗するという脆弱性があり、それによりデータ損失につながるケースは、決して少なくないのも事実です。
■ RAIDのデータ復旧技術:Data_Array&Restoration技術
ストライプサイズでセクタをチャンクと呼ばれる塊で分割し、各データを分散することにより、
速さや耐久性向上を図ったもの、とされてはおります。
|
「リビルド」できず、データ復旧をご相談いただく事が大変多い傾向です。
リビルドとは、正常な状態に戻す作業を指しますが、確実に成功できることは保証されておらず、失敗の場合、それ以上は修復できません。
このため、RAIDであっても、バックアップが絶対に必要となります。
|
■ RAIDの動作モードについて
ここでは、6種類のRAIDに関しまして、ご紹介いたします。
2021年更新:単独の容量を大きくしてRAID-6にするのが、おすすめの構成です。
■ RAID-0(ストライピング)
速度面向上が目的で、データ保護性は全くありません。
|
64KBや128KBなどのストライプサイズでデータを分散させ、高速化を図ります。
1台でも故障いたしますと全データにアクセスできなくなる脆弱性がございます。
|
■ RAID-1(ミラーリング)
速度面は単独の場合と同じです。データ保護性は台数に比例して大きくなります。
|
セクタレベルでデータをミラーいたします。
1台以上が故障しても、1台さえ残ればデータが温存されるメリットがございます。
ただし、ビット腐敗の問題が絡んで、都合通りにはいかない場合が多いです。
|
■ RAID-5 (パリティ付ストライピング)
速度面は読み込み向上、書き込みはパリティ計算で速度低下です。
データ保護性は台数に比例して「低下」いたします。
|
RAID-0の分散処理に、偶数パリティを入れた構成となります。
偶数パリティとは、論理計算を行い、失われた部分を他の要素から補填するものです。
これを利用して修復する作業をリビルドと呼びまして、壊れた分の再構築を自動で実施できる機能が備わっております。
また、この偶数パリティの総容量は「ディスク1台分」に相当するため、RAID-0と比べて1台余分に必要となりますが、この1台までの破損ならば、問題ないとされております。
しかしながら、徐々に劣化する物理障害を見抜く事ができないため、壊れたときには、残りのディスクも壊れていて、リビルドできないという脆弱性がございます。
また、2台以上同時に破損した場合も同様です。
|
■ RAID-6
RAID-5の改良版です。2重のパリティ計算が存在します。
|
RAID-5は1台破損までの対応となりましたが、RAID-6は、2台までに拡張されます。
単独の容量を大きくしてRAID-6にするのが、おすすめの構成です。RAID-10では台数が多過ぎるからです。
|
■ RAID-10(1+0または0+1)
構成によって、速度面および保護性能が変わります。
|
RAID-0とRAID-1を組み合わせた構成となります。
※ RAID-10を組む場合は、ミラーリングしたものをストライピングする1+0の方を必ずご利用ください。
ストライピングしたものをミラーリングする0+1では、データ保護性が低下いたします。
|
■ スパニング
速度面は単独の場合と同じです。データ保護性は「低下」するため、容量がつながるだけです。
|
各ドライブをセクタ順につなげただけの構成をスパニングと呼び、保護性能が低下するため、利点はありません。
|
データスキャン作業に関しましては、「並列同時解析」による一括処理です。
RAIDで重要となるデータ整合性検査は、RAID専用に開発いたしております。
並列処理に融合させた検査となりまして、バッファを検査へ流用し、2度目のバッファ処理を防ぎます。
※ 別処理で乗せてしまうと、バッファへの2度読みが発生し、時間的に大きな不利となります。
>>データスキャン作業(必要台数へ実施)>>データ整合性検査
ドライブ取出作業>>初期診断作業>>損傷分布検査作業
>>クリーンルーム作業>>データスキャン作業(必要台数へ実施)>>データ整合性検査
■ ドライブ取出作業
データ復旧の実施に必要となる全ドライブを、RAID装置から取り出す作業となります。
全てのドライブを調査いたしますので、全て取り外します。
■ 初期診断作業
「初期診断作業」(ドライブ単独)を、各ドライブに実施いたします。
1、最短時間にて、HDD(SSD)に負担がないよう診断を実施いたします。現在の状況を把握します。
2、スキャンが通常(レベル1~2、クラスタ)レベルで可能か判断いたします。
3、2の過程で不可判定の場合、別の手法(セクタ単位レベル)を試します。
4、3の過程で不可判定の場合、クリーンルーム作業を検討します。
※ 1の段階であっても、非常に危いと判断できる場合には、クリーンルーム作業検討となります。
データ復旧作業では、例外的な処理が多く、臨機応変に対応する必要性がございます。
※ 2、3は独自ソフトウェアにて素早く実施いたしております。
■ 損傷分布検査作業
損傷度合いの全体分布を予測し、作成します。
この結果から、クリーンルーム作業の必要性を検討します。
分布図より読み取れる範囲が小さいと推測される場合は、
クリーンルーム作業により復活させる必要性ありとなりますし、複数のドライブで一つのアレイ(データ)を成しておりますので、
最善の選択、すなわちどのドライブを回復させるか、判断を仰ぐ必要が必ず生じます。
2台のミラーリングで両方破損の場合、損傷分布検査作業にて状態の良い1台が選び出されます。
状態の良い方からデータを復旧する作業により、復旧率の点でお客さまのご期待にお応えいたします。
損傷分布に関して:
電源を入れているだけでも広がって行く傾向がありまして、各ドライブの損傷度合いを見抜くのに必須な作業となります。
実際には数値化ではなくグラフ化してしまいます。その方が着実に分かるためです。
選定されたドライブに対し、復旧方針を立てます。
それから、最適な作業(クリーンルーム作業・データスキャン作業)を実施いたします。
□ クリーンルーム作業
1、[少しでも最良な条件を作る]:HDD/SSDに付着するホコリをできる限り除去します。
2、[表面検査]:トップカバーの開封に着手し、プラッタ表面の状態を検査します。(スキャンに応用します)
3、[破損個所回収]:正常動作を阻害する直接的な要因を全て取り除きます。(例:吸着したヘッド等)
4、[剥離した磁性体除去]:内部の汚れている個所(削られた磁性体)を除去し、それらを回収します。
5、[内部部品交換]:破損した部品を全て取り除き、正常品から取り外したものと交換します。
6、[最終チェック]:全部品を再確認いたします。確認のち、トップカバーを閉じで作業完了です。
7、[ファームウェア修復]:状況によっては、ファームウェア系統の修復を実施します。
|
単独ドライブの場合と、同じ作業を実施いたします。
複数のドライブを単につなげただけですので、その故障に関しましては、1台ずつ別々に修復いたします。
もちろん、損傷分布検査作業で必要ないと判断されたドライブには処置いたしません。
|
■ データスキャン作業, データ再構築作業
データスキャン以降を一括処理できる、RAIDマスターツール(並列同時解析)を独自開発いたしました。
現在、RAIDのデータ復旧を着実に処理できる「並列同時解析」を独自に開発いたしました。
ドライブ型番別に「スキャンマップ(パターン)」をもち、はじめに概算的な調整がなされます。
■ RAIDでは更に重要なデータ整合性検査
RAIDのデータ復旧にて主要となるのは「データ整合性検査」です。
データが化けていないかどうか独自の検査方法で確実に判断するものとなっております。
「データがバラバラで、ほとんど(一切)開かない状態で納品された」例などは、この検査が行われていないことを示します。
データリストにファイル名が存在しても、この検査がないとそのような場合も十分に考えられます。
この検査では、ファイル名があってもほとんど開かないという状況を100%防ぐことのできる検査です。
コンピュータによるファイル自走検査、高クオリティおよびプライバシーを確保いたします。
以下「ファイル自動走査」にて、ファイル構成が正しいかどうか検査中です。