3, 不良セクタに関する考察 不良セクタの分類について 種類・分布・発生量から、その危険性を考えていきます

ホーム運用技術→運用技術について→3, 不良セクタに関する考察

3, 不良セクタに関する考察

システムリカバリ

3a, セクタ、クラスタの概念

ドライブの最小記録単位がセクタ、ファイルシステムの最小記録単位がクラスタと呼ばれます。
ここで、クラスタサイズが一般的に4096バイトとなるため、これに合わせた次世代?セクタも出てきております。
ただしこれは、飛躍的な性能向上を謳うものではなく、あくまで容量確保上の都合です。
ドライブの運用上において、最小の1セクタ単位でアクセスする訳ではありません。 セクタを重ねてアクセスできますので、従来からある複数のセクタを1クラスタにする方法でも速度的には何の影響もありません。
それゆえ、クラスタサイズと同等のセクタに高等の意味合いを持たせる点は、少々違和感を覚えます。

3b, 不良セクタの概念

読み出せなくなったセクタを不良セクタと呼びます。
また、クラスタはセクタを包含いたしますので、同時に不良クラスタとも呼ばれております。
そして、ドライブの検査またはデータ復旧において、このセクタの取り扱いがドライブの命運を決めてしまいます。
なぜなら、この読み出せなくなった原因が複雑かつ分岐するうえ、 ドライブやOSに備わる「大事なルール・・・キューを完結させる」がサイドエフェクトのように効いてきて、状態を決めてしまうからです。

3c, 「大事なルール」の比喩について

3bで出てきました「大事なルール」・・・これをわかりやすくたとえますと、レバレッジとなります。
最小の1セクタ単位を1倍といたしまして、たとえば、256セクタ単位の場合は256倍と定義いたします。
ドライブの動作環境が良好で問題ない場合は、256倍にて最大に近い処理速度を享受することになります。
ところが、ここで「大事なルール・・・キューを完結させる」という鉄壁に囲まれることになります。
この読み書きのキューは必ず完結させるというルールは、ドライバにも組み込まれており、絶対的です。
そして、恒久的な良好を約束されたドライブは一切存在いたしません。いつかは、壊れます。

しかも、ドライブの破損は予期せず唐突に起こります。
このとき、1倍ならばキューが即時完結するため、制御が戻り、すぐに他の場所へ逃げてドライブの損傷を抑え込む(保護)ことができます。 しかし、256倍ならば、このキューの処理は困難を極めます。その破損個所につかまったまま、終焉を迎えることでしょう。

3d, 不良セクタの発生

「代替セクタ」や「不良セクタ待ち」など、不良化を防ぎ切れなくなった瞬間に、不良セクタが出ます。
※ 不良セクタ化を防ぐためのエラー訂正機構により、仮に新品であっても、一定量のエラーは存在いたします。

3e, 不良セクタの分類

以下の条件で分類いたします。
※ 以下条件1~7:HDD, 条件1、3~4、8~9:SSD となります。

条件1:読み込み不能セクタ・・・・・・読み込みできなくなったセクタ
条件2:書き込み不能セクタ・・・・・・書き込みできなくなったセクタ
条件3:再発読み込み不能セクタ・・・・時々、読み込み不能セクタとなる
条件4:拡散読み込み不能セクタ・・・・読み込み不能セクタが拡散のち、多方面に広がる主原因となるセクタ
条件5:再発書き込み不能セクタ・・・・時々、書き込み不能セクタとなる
条件6:拡散書き込み不能セクタ・・・・書き込み不能セクタが拡散のち、多方面に広がる主原因となるセクタ
条件7:ヘッド劣化系不良セクタ・・・・エラー訂正が安定せず、読み書きが確率的に不安定となるセクタ
条件8:フラッシュ系一時不良セクタ・・読み込みできない区間が突如発生、しかし、修復可能なセクタ
条件9:フラッシュ系恒久不良セクタ・・読み込みできない区間が突如発生、さらに不良化のまま修復できないセクタ

こちらの統計レストレーション機能(2018年リリース見込み)を条件7(HDD)、条件8(SSD)に対して処理いたしますと、以下のような動きとなります。 修復が効いたと思った途端に、不良セクタになろうとする勢力が上から下へ増してきまして、上昇を抑え込んでいます。
※ 動作が安定しないドライブほど、この形状に近くなります。

統計レストレーション結果

3f, 不良セクタの組み合わせ

3eの条件1~条件9を組み合わせます。

条件A:読み書き不能セクタ・・・・・・・・・・・条件1と条件2の両方を満たすセクタ
条件B:再発読み書き不能セクタ・・・・・・・・・条件3と条件5の両方を満たすセクタ
条件C:拡散読み書き不能セクタ・・・・・・・・・条件4と条件6の両方を満たすセクタ
条件D:突発的な拡散読み込み不能セクタ・・・・・条件3または条件4となるセクタ
条件E:突発的な拡散書き込み不能セクタ・・・・・条件5または条件6となるセクタ
条件F:突発的な拡散読み書き不能セクタ・・・・・条件Dまたは条件Eとなるセクタ
条件G:動作が安定しない読み書き不能セクタ・・・条件7または条件8となるセクタ

条件D・E・Fは、不安定となって読み書きが定まらない場合に起こります。
※ 条件Dの例:読んだと思ったら読み込めないときがあり、条件4が揃い次第、一気に拡散いたします。

3g, 不良セクタとS.M.A.R.T.の関係

不良セクタが発生いたしますと、再配置カウント(0x05)の数値が上昇いたします。
再配置カウント(0x05)が一気に急上昇した場合は、ほぼ不良セクタ確定と言えます。
ところが、不良セクタが発生のち、必ず再配置カウントが急上昇するとは限らないゆえ、その判断は難しいです。

□ 逆に、再配置カウント(0x05)が急上昇した場合も、不良セクタの発生とは断定できないドライブが沢山ございます。 このため、セクタ単位の検査結果を第一に信用する点が重要となります。

□ そして、以下のような誤りがS.M.A.R.T.には存在いたします。
※ S.M.A.R.T.は正常(短期・中長期ともに正常)、再配置カウント(0x05)は0にも関わらず、ドライブが故障に至る例です。 こちらに搭載いたしましたS.M.A.R.T.コンセンサス(コンセンサスの仕組みを活用し、従来は半日を要するような大容量ハードディスクの故障判断を「数分」で実施する機能)は、これを見逃しません。
曖昧な「注意」ではなく、「交換」を促しております。「最後のデータの逃げ場」をきちっと捉えます。

S.M.A.R.T.コンセンサスの結果

3h, 考察

3ha:読み込み不能セクタ [HDD, SSD]

エラー訂正が効かずに、データが返せない状態です。その代わりにエラーを返します。
※ 代替は、このセクタが「書き込み」された際に割り当てられ、一時的に復帰します。
※ 読み込めないセクタが気が付かないうちに増殖するため、読み出せるかどうか不定となる「ドライブ自動バックアップ」や「2台構成のミラーリング」などの機構に危険性が出てきます。
※ データが虫食い状態に陥るのは、このセクタが拡散すると起こります。

発生要因

ごく自然に発生いたします。(経年劣化)
また、一度書き込み終えて長時間経過後、このセクタに変化する事もあります。
※ バックアップを取ろうと試みまして、失敗するパターンが該当いたします。

発生頻度 IDE / SATA / M.2.の各ドライブでは高く、信頼重視のSCSI / SASは低い傾向となっております。
データ損失 データが返せませんので、損失となります。 また、統計的に使用頻度が高いセクタがやられますと、損失の幅が大きくなりがちです。
危険度 一度でも発生いたしますと、少し増殖して、止まるものもあります。 ただ、まず増えるとみて間違いありません。 拡散するパターンが存在いたしまして、多種多様で、場合分けは到底できません。
予防法 A、全セクタの検査を実施いたします。
B、転送レートが大きく変動していない事を必ず確認いたします。
A・Bのいずれかで異常が認められた場合は、即時換装いたします。
注意点 バックアップを全て自動に任せている方は要注意となります。
※ 一カ月に一度でも構いませんので、手動によるバックアップを実施いたしまして、全データが読み込めるかどうかを確認いたします。
※ その際、僅かでも異常が確認された場合は、ドライブの換装を実施いたします。

3hb:書き込み不能セクタ [HDD]

エラーが発生いたしまして、書き込みが停止する状態となります。
※ 読み込みの方も不安定に陥りまして、いつ完全に壊れても全く不自然ではない状態に移行いたします。
※ データ書き込み中にドライブが異状に陥った場合、それは危険信号と捉えるべきです。

発生要因

ヘッド&プラッタの損傷を含む、物理的な故障です。
ただし、「3ha:読み書き不能セクタ」と大いに異なるのは、読み込み可能な場合がある点です。
それに対し、「3ha:読み書き不能セクタ」は再試行しても、読み込める事は決してありません

発生頻度 突発的な故障ですので、いつでも起こりえる障害と考えられます。
データ損失 ヘッドが破損している場合、プラッタ表面に傷を入れてしまい、データ損失は広がっていきます。
書き込みに失敗した地点で、重要なデータをすぐに退避させる心構えが必要です。
危険度 内部の部品が壊れておりますので、危険度は高くなります。

3hc:読み書き不能セクタ [HDD, SSD]

エラーから、代替セクタが底を付きまして、さらに一時的な復帰も叶わずに読み込みもできない状態から「読み書き不能セクタ」に変化した状態です。

発生要因

代替セクタが底をつく前に、プラッタの傷や磁性体の異常により起こります。
※ 動作温度が高いと起こり易くなるため、ドライブは冷却すべきとよく言われております。
※ 書き込み不能とは異なり、読める事は一切ありません。そして、読み出しのエラーの検出が起因となります。
※ SSDの場合、書き込みの力が尽きると、読み込み専用に変化してからこの状態に遷移するとされています。 しかし、これを期待してバックアップなしで運用することは、否です。 たとえば、M.2. SSDでは「自分自身が制御不能となる物理障害」を多数拝見しております。 SSDのパッケージには、この遷移がHDDとの圧倒的な差という謳い文句が散らばっている場合を多く見受けますが、絶対に、鵜呑みにしてはいけません。

発生頻度 気持ち程度はS.M.A.R.T.による監視が有効ですが、僅かな変化でもクラッシュに達する場合があります。
データ損失 データが返せずエラーとなりますので、損失につながります。
また、統計的に使用頻度が高いセクタがやられますと、損失の幅が大きくなりがちです。
危険度 一度発生いたしますと、少し増殖して止まるものもありますが、拡散する場合もあります。

※ リスクの高いミラーリング(参考:こちら)の場合であっても、この破損が先であれば、危機的な状況に陥る前に助かる可能性があります。 エラーが手に負えない程に積み重なる前に、コンピュータの動作が停止するためです。
※ S.M.A.R.T.による監視は、気持ち程度となりますが、この「読み書き不能セクタ」のみ有効と考えられます。ただし、S.M.A.R.T.が警告を発しましても、買って間もない場合は「誤報」の可能性が高いです。
※ 初期不良の場合、監視する間もなく壊れます。このため、S.M.A.R.T.以前の問題とも捉える事ができます。

3hd:再発読み込み不能セクタ [HDD, SSD]

「読み込み不能」を再発するセクタが、これに該当いたします。

読み込み不能セクタ発生(1度目) =>> 書き込み処理により復帰 =>>
以下の条件を満たすと、また読み込み不能に変化 =>> 書き込み処理により復帰 (繰り返し)

◆ 条件について:
読み込み不能セクタ発生時、読み取り不能に化ける挙動が収まれば、それ以上のデータ損失は免れる事になります。
しかし、これが繰り返されてしまいますと、確率的に「いつかは重要なデータが犠牲になる」状況になります。

発生要因

読み込み不能セクタと同じく、自然に発生いたします。(経年劣化)
※ 一度、書き込み終えまして、長時間を経過後、このセクタに化ける事があり、それが、何度も再発してしまいます。
※ 再発には何らかの「きっかけ」が必要で、今のところ電力不足(HDDの場合)を確認しております。
この点より、常に電力不足で運用されている場合、この種類のセクタを既に抱えている可能性があります。
※ SSDの場合でこの症状を引き起こした場合、寿命となります。 これは、不良セクタの修復(こちらの機能)を試みて成功したとしても、まともな動作は期待できない事を意味いたします。 すでに修復可能な条件を満たしていない点にご注目ください。乖離率は大きく、書き込み速度が出ていません。SSDの末期症状です。

発生頻度 ビット腐敗(詳しくはこちら)
データ損失 データが返せず、さらに拡散型(周辺まで巻き込む)へと悪化する場合が多々あります。
このため、非常に大きな損失につながります。
危険度 非常に怖いセクタです。

※ S.M.A.R.T.数値は正常を振舞っているが、壊れている場合がとても多く、それらが引き金となり、大きな損失につながる危険性があります。
※ はじめの読み込み不能セクタは、範囲が自分自身または小規模ゆえ、その発見が難しく、知らないうちに起きる書き込み操作により元に戻っている事が多々ございます。
※ しかし、それらが再発し、拡散した瞬間に損傷範囲が大きく広がります。 結局、大部分に拡散した瞬間に、はじめて読み込みできない事に気が付き、データを戻すのが容易ではなくなります。日頃のバックアップが重要です。

3he:拡散読み込み不能セクタ [HDD, SSD]

再発した読み込み不能セクタが拡散し、ドライブの機能を奪い取るセクタとなります。
これらが生じた場合、既に物理的修復処置(クリーンルーム)なくてはデータサルベージ不可となります。
※ HDDの故障はヘッドクラッシュによる異音が一般的と思われておりますが、このような故障も多発しております。
※ SSDの場合、この症状ではデータを引き抜くのが困難です。案外、壊れかけの場合はHDDの方が復旧し易いです。

※ 再発ではなく、一回目の読み込み不能から拡散する場合もあります。(確率としては低い)
※ 厄介な点といたしまして、拡散する直前までは正常に稼動できてしまう点です。 確かに、拡散する前の読み込み不能セクタは一部分に限定して存在しておりますので、それに気が付く事ができません。

※ 拡散読み込み不能セクタの具体例
ハードディスク「物理障害発生」までの経緯:
1、使用中に突然、数個のファイルが読み出せなくなる。(読み込み不能、1つ目)
2、特に必要ではないファイルなので放置し、気にせずに使用を再開する。(読み込み不能を放置)
3、また使用中に、一つのファイルが読み出せなくなる。(別の個所が読み込み不能)
4、気掛かりとなりまして、別のファイルをコピーした所、なぜか成功。(書き込みにより、不能状態から復帰)
5、そこで、チェックディスクを実行し、こちらも成功。(書き込みで復帰させた状態なので、エラーはない)
6、しかし、数日後に読み出しできないファイルが急に増加。近日中にバックアップすると決める。(このあたりで再発)
7、翌日、電源を入れたら動作不能で停止。Windows自体が起動できなくなる。(突然の拡散読み込み不能セクタ)
8、ドライブを取り出し、外付けにしたが、コピーはおろか、データが一切閲覧できない状態になる。

3hf, 巡回冗長検査エラー(CRCエラー) [HDD, SSD]

コピーの際、動作が停止いたしまして「巡回冗長」を含むエラーが表示される場合です。
複雑そうにみえますが、これは単に「該当セクタが読めないからコピーを停止」という意味となります。
この原因といたしましては、読み込み不能セクタ(再発&拡散)、読み書き不能セクタが考えられます。
※ 拡散いたしますと物理的修復処置なくてはサルベージ不可となりますので、少しずつデータを退避させてください。

3i, 次項へのつなぎ

不良セクタは単に読めないセクタという解釈では不十分で、このような複雑な要因が絡み合いますので、不良セクタが発生した場合は、しっかりその性質を掴んでから次の行動を考える必要があります。 次項では、その対処方法(バックアップ、不良セクタ修復、チェックディスク実行等)をみていきます。

ただ、これらを手作業で分類・解析するには、骨が折れる内容で、わざわざ対処するには面倒です。
そこで、自動的に調査可能なソフトウェア(もちろんフリー)があれば・・(^^;
以上の分類を簡単に実現するべくソフトウェアの方を開発・公開いたしました。
※ フリーソフトウェアとなります。
※ Windows 10 / 8.1 / 8 / 7 / Vista / XP / 2000(Build 2820まで) に対応いたします。
※ Mac版につきましても、2018年にリリースの見込み(移植)で進めております。

完全スキャン

※ ダウンロードはこちらよりお願いいたします。
※ インストール不要版もあります。こちらはレジストリに書き込みせず、その場限りでご利用いただけます。
「データ温存」方式による検査ですので、データには一切影響ございません。ご安心ください。
● 読込不能(黄色)・・・条件1を検出
● 読書不能(紫色)・・・条件Aを検出
● 動作安定度・・・・・条件3~6、D~Fを検出
● 危険(赤色)・・・・・総合的に考え、危険と判断されたセクタ。赤に限り、一つでも出たらすぐに交換です。

■ 各機能のご紹介 ■

完全スキャン

■ [2010-0804] ハードディスク, SSDのメンテナンス

[全エディション対応]
全セクタを検査できる完全スキャンです。
不良セクタ検出および、ドライブの「動作安定度」を算出いたします。
新たな指標で危険なセクタを検出いたします。

統計スキャン

■ [2013-10] ドライブ故障統計を利用する誤差のない統計スキャン

[サポートエディション以上対応]
完全スキャンの誤差をドライブ故障統計から改善いたしました。
さらに、グラフの方も統計タイプに入れ替え、使い易さも大幅に向上させております。

不良セクタシミュレーション

■ [2010-0804] 不良セクタシミュレーション

[全エディション対応]
今までにないスキャンを実現いたしました。
近い将来発生する不良セクタを、先回りで検出いたします。
このような性質上、「故障前の事前的な予防交換」などに最適なスキャンです。

不良セクタレストレーション

■ [2010-0826] 不良セクタレストレーション

[全エディション対応]
大容量HDDに発生しがちな、軽微な不良セクタを修復することができます。
不良セクタシミュレーションをベースに開発したため、近い将来発生する不良セクタも修復対象です。

ヘッドレストレーション

■ [2011-0905] ヘッドレストレーション

[サポートエディション以上対応]
壊れかけHDDを制御し、新しいHDD/SSDへセクタイメージを転送します。
いわゆる、物理解析を実施できる機能です。

ベンチマーク

■ [2010-0804] ストレージベンチマーク

[全エディション対応]
接続されております各ストレージの速度を計測いたします。
同時計測・単独計測をサポートいたしております。

故障予測

■ [2010-1103] ストレージ故障予測

[全エディション対応]
S.M.A.R.T.および故障予測スキャンを自動化、万全な体制で予測を行います。
S.M.A.R.T.のみでは対応できない部分までしっかりサポートします。

バックアップ

■ [2010-1103] 緊急・定期バックアップ

[サポートエディション以上対応]
定期バックアップに加え、故障直前のデータも逃さない緊急バックアップを標準装備しております。
故障予測と併用し、メンテナンスフリーを確立します。

S.M.A.R.T.ビュー

■ [2010-0804] S.M.A.R.T.ビュー

[全エディション対応]
ドライブの情報を細部まで表示いたします。

故障予測ビュー

■ [2010-1103] 故障予測ビュー

[全エディション対応 制限モード(フリー)の場合は制限あり]
ドライブの故障予測情報を細部まで表示いたします。

故障予測スキャンモニタ

■ [2010-1103] 故障予測スキャンモニタ

[全エディション対応 制限モード(フリー)の場合は制限あり]
新しい「スキャン方式」の故障予測を実行いたします。

故障予測 S.M.A.R.T.情報モニタ

■ [2010-1103] 故障予測 S.M.A.R.T.情報モニタ

[全エディション対応]
従来のS.M.A.R.T.に対しまして、独自しきい値を採用した故障予測を提供いたします。

データ復旧

■ [2010-0804] 写真・画像データ復旧

[全エディション対応]
メンテナンス系に加え、データ復旧・修復機能をサポートいたします。
万一の場合も安心してご活用いただけます。

アドバンストデータ復旧

■ [2012-1017] アドバンストデータ復旧, 並列同時解析

[サポートエディション以上対応]
壊れたファイル構造からデータを復旧する論理解析を実施できます。
いわゆる、データ復旧ソフトウェアとなります。
万一の場合も安心してご活用いただけます。

つなぎ復旧

■ [2014-0722] 不良セクタ危険予知

[サポートエディション以上対応]
物理障害の区間を上手く処理できる「不良セクタ危険予知」をサポートいたしました。
従来では先に進めなかった区間も、この機能で読めるようになります。

個人情報探索

■ [2014-0722] 個人情報探索, ファイル内部探索

[プロエディション対応]
個人情報を含むファイルを素早く内部まで探索いたします。
普段使われているパソコンの内部チェック、
または、これから持ち出すパソコンなどの内部状況把握にご利用ください。

ファイル名高速検索機能

■ [2014-0908] ファイル名高速探索機能, 頻度曖昧検索

[全エディション対応]
検索の度に検索用ツリーを生成し、高速検索いたします。
検索向けに、事前にキャッシュやインデックスを必要といたしません。
また、事前な仕掛け無しに、頻度を曖昧に検索する機能を追加しております。

エコモード

■ [2010-0804] エコモード (ATAコマンド制御)

[全エディション対応]
ATAコマンドを多数発行できるインターフェイスです。
補助サポートが多数付属し、簡単にご利用いただける環境を整えました。
お気軽にご活用いただけたら幸いです。

エコモード++

■ [2011-0905] エコモード++ (電力会社別管理&データ保護)

[全エディション対応]
電力会社別(電力需要)に合わせてHDD/SSDを制御し、節電とデータ保護を実現いたします。
お気軽にご活用いただけたら幸いです。

データ転送グラフ化機能

■ [2010-0804] 転送レートグラフ化機能

[全エディション対応]
ストレージの転送レートをグラフ化する機能です。
お気軽にご活用いただけたら幸いです。

データ転送グラフ化機能

■ [2010-0804] シミュレーション解析設定

[プロエディション対応]
シビアな状況をテストできる各シミュレーションを実行できます。
メーカ・型番別に細かくパターン化され、最適なテスト・検査を実施します。
※ シビアな条件を要求される法人様向けの機能です。