徐々に劣化の影響が拡散するRAIDの脆弱性
お客さまよりお伝えいただいた症状
HDD1の障害発生に伴いドライブ交換を行ったがリビルド中にHDD2で障害が発生。
データにアクセスできなくなった。ログからの障害履歴。+00:00後 HD1 故障。「E30 replace disk」メッセージ表示 +08:54後 シャットダウン 開始 起動 +09:03後 HD1 故障。「E30 replace disk」メッセージ表示 +09:04後 シャットダウン 開始 起動 +09:18後 HD1 故障。「E30 replace disk」メッセージ表示 +09:19後 HD1 交換 +18:20後 HD1 故障。
「E30 replace disk」メッセージ表示 +18:20後 HD2 故障。「E30 replace disk」メッセージ表示 +18:21後 HD1 交換 +29:39後 シャットダウン 開始 起動 +29:49後 1番のRAIDアレイがマウントできない。+29:49後 HD2 故障。「E30 replace disk」メッセージ表示 以上です。
症状の断定
一部のヘッドの機能低下
採用技術:ヘッドレストレーション&不良セクタ最適化技術(統計)
RAIDのリビルド中、他のドライブに障害が発生してしまう物理障害を抱えておりました。
リビルド中に発生する物理障害の原因は、徐々に劣化するドライブの特性にあります。この特性により、劣化具合が分からないまま運用されてしまい、肝心なリビルド時に障害が出てしまいます。リビルドはドライブの全エリアへアクセスを要求いたしますので、劣化していると直撃を受けてしまいます。このような場合、全台に対しまして、全体をデータスキャンすることにより生きているセクタを全て取り出します。
それから、生きている部分を優先的に採用して全体のRAIDイメージを生成することにより失われた部分をゼロに近付けます。そして、そのRAIDイメージを再構築することにより、綺麗に復旧できる事例です。
関連記事
データ復旧サービス、お気軽にご相談ください。お持ち込みにも対応しております。
