◇ [HDD/SSD/NVMe] 不良セクタの分類について

セクタ/クラスタの概念

ドライブの最小記録単位をセクタと呼び、ファイルシステムの最小記録単位をクラスタと呼びます。

ここでクラスタサイズが一般的に4096バイトとなるため、これに合わせた次世代4096セクタも出てきております。ただしこれは、飛躍的な性能向上を謳うものではなく、あくまでHDDの容量確保上の都合です。

ドライブの運用上では、最小セクタ単位でアクセスする訳ではありません。セクタを重ねアクセスできますので従来からある複数のセクタを1クラスタにする方法でも速度的には何の影響もありません。それゆえ、クラスタサイズと同等のセクタに高等の意味合いを持たせる点は少々違和感を覚えます。

実際に、次世代セクタサイズが採用されているのは主にHDDで、構造的に利点がないSSDでは互換性が抜群で相性が出ない従来の512セクタが主流です。

不良セクタの概念

読み出せなくなったセクタを不良セクタと呼びます。また、クラスタはセクタを包含いたしますので、同時に不良クラスタとも呼ばれております。そしてドライブの検査またはデータ復旧において、このセクタの取り扱いがドライブの命運を決めてしまいます。なぜならこの読み出せなくなった原因が複雑かつ分岐するうえ、ドライブやOSに備わる「大事なルール……キューを完結させる」が状態を決めてしまうからです。

不良セクタの発生

「代替セクタ」や「不良セクタ待ち」など、不良化を防ぎ切れなくなった瞬間に、不良セクタが出ます。不良セクタ化を防ぐためのエラー訂正機構により、仮に新品であっても一定量のエラーは存在いたします。

不良セクタの分類

以下の条件で分類いたします。
以下条件1~7:HDD, 条件1、3~4、8~9:SSD となります。

条件1:読み込み不能セクタ
読み込みできなくなったセクタ
条件2:書き込み不能セクタ
書き込みできなくなったセクタ
条件3:再発読み込み不能セクタ
時々、読み込み不能セクタとなる
条件4:拡散読み込み不能セクタ
読み込み不能セクタが拡散のち多方面に広がる主原因となるセクタ
条件5:再発書き込み不能セクタ
時々、書き込み不能セクタとなる
条件6:拡散書き込み不能セクタ
書き込み不能セクタが拡散のち多方面に広がる主原因となるセクタ
条件7:ヘッド劣化系不良セクタ
エラー訂正が安定せず読み書きが確率的に不安定となるセクタ
条件8:フラッシュ系一時不良セクタ
読み込みできない区間が突如発生、しかし修復可能なセクタ
条件9:フラッシュ系恒久不良セクタ
読み込みできない区間が突如発生、さらに不良化のまま修復できないセクタ

こちらの統計レストレーション機能(2018年リリース見込み)を条件7(HDD)・条件8(SSD)に対して処理いたしますと、 以下のような動きとなります。修復が効いたと思った途端に不良セクタになろうとする勢力が上から下へ増してきまして、上昇を抑え込んでいます。 動作が安定しないドライブほど、この形状に近くなります。
※ ドライブリアルタイム解析は、FromHDDtoSSD ビルド番号:6000以降に、システムリカバリの一部として搭載見込みの機能です。

不良セクタの組み合わせ

3dの条件1~条件9を組み合わせます。

条件A:読み書き不能セクタ・・・・・・・・・・・条件1と条件2の両方を満たすセクタ
条件B:再発読み書き不能セクタ・・・・・・・・・条件3と条件5の両方を満たすセクタ
条件C:拡散読み書き不能セクタ・・・・・・・・・条件4と条件6の両方を満たすセクタ
条件D:突発的な拡散読み込み不能セクタ・・・・・条件3または条件4となるセクタ
条件E:突発的な拡散書き込み不能セクタ・・・・・条件5または条件6となるセクタ
条件F:突発的な拡散読み書き不能セクタ・・・・・条件Dまたは条件Eとなるセクタ
条件G:動作が安定しない読み書き不能セクタ・・・条件7または条件8となるセクタ

条件D・E・Fは、不安定となって読み書きが定まらない場合に起こります。条件Dの例:読んだと思ったら読み込めないときがあり、条件4が揃い次第、一気に拡散いたします。

不良セクタとS.M.A.R.T.の関係

不良セクタが発生いたしますと、再配置カウント(0x05)の数値が上昇いたします。 再配置カウント(0x05)が一気に急上昇した場合は、ほぼ不良セクタ確定と言えます。 ところが、不良セクタが発生のち、必ず再配置カウントが急上昇するとは限らないゆえ、その判断は難しいです。 逆に、再配置カウント(0x05)が急上昇した場合も、不良セクタの発生とは断定できないドライブが沢山ございます。 このため、セクタ単位の検査結果を第一に信用する点が重要となります。そして、以下のような誤りがS.M.A.R.T.には存在いたします。
※ S.M.A.R.T.は正常(短期・中長期ともに正常)、再配置カウント(0x05)は0にも関わらず、ドライブが故障に至る例です。 こちらに搭載いたしましたS.M.A.R.T.コンセンサス(コンセンサスの仕組みを活用し、従来は半日を要するような大容量ハードディスクの故障判断を「数分」で実施する機能)は、これを見逃しません。
※ 曖昧な「注意」ではなく「交換」を促しております。最後のデータの逃げ場をきちっと捉えます。

読み込み不能セクタ [HDD, SSD]

エラー訂正が効かずに、データが返せない状態です。その代わりにエラーを返します。
※ 代替は、このセクタが「書き込み」された際に割り当てられ、一時的に復帰します。
※ 読み込めないセクタが気が付かないうちに増殖するため、読み出せるかどうか不定となる「ドライブ自動バックアップ」や「2台構成のミラーリング」などの機構に危険性が出てきます。データが虫食い状態に陥るのは、このセクタが拡散すると起こります。

ごく自然に発生いたします。また一度書き込み終えて長時間経過後、このセクタに変化する事もあります。バックアップを取ろうと試みまして、失敗するパターンが該当いたします。

発生頻度信頼重視のSCSI/SASは低い傾向です。なぜならもともとのエラー率が低いからです。
データ損失データが返せませんので損失となります。 また、統計的に使用頻度が高いセクタがやられますと損失の幅が大きくなりがちです。
危険度一度でも発生いたしますと、少し増殖して、止まるものもあります。 ただ、まず増えるとみて間違いありません。拡散するパターンが存在し、多種多様で、場合分けは到底できません。
予防法全セクタの検査を実施いたします。転送レートが大きく変動していない事を必ず確認いたします。
注意点バックアップを全て自動に任せている方は要注意となります。
※ 一カ月に一度、手動によるバックアップを実施いたしまして、全データが読み込めるかどうかを確認いたします。
※ その際、僅かでも異常が確認された場合は、ドライブの換装を実施いたします。

書き込み不能セクタ [HDD]

エラーが発生いたしまして、書き込みが停止する状態となります。
※ 読み込みの方も不安定に陥りまして、いつ完全に壊れても全く不自然ではない状態に移行いたします。 データ書き込み中にドライブが異状に陥った場合、それは危険信号と捉えるべきです。

ヘッド&プラッタの損傷を含む、物理的な故障です。ただし、「3ga:読み書き不能セクタ」と大いに異なるのは、読み込み可能な場合がある点です。それに対し、「3ga:読み書き不能セクタ」は再試行しても、読み込める事は決してありません。

発生頻度突発的な故障ですので、いつでも起こりえる障害と考えられます。
データ損失ヘッドが破損している場合、プラッタ表面に傷を入れてしまいデータ損失は広がっていきます。書き込みに失敗した地点で重要なデータをすぐに退避させる心構えが必要です。
危険度内部の部品が壊れておりますので、危険度は高くなります。

読み書き不能セクタ [HDD, SSD]

エラーから、代替セクタが底を付きまして、さらに一時的な復帰も叶わずに読み込みもできない状態から「読み書き不能セクタ」に変化した状態です。

代替セクタが底をつく前に、プラッタの傷や磁性体の異常により起こります。
※ 動作温度が高いと起こり易くなるため、ドライブは冷却すべきとよく言われております。
※ 書き込み不能とは異なり、読める事は一切ありません。そして、読み出しのエラーの検出が起因となります。SSDの場合、書き込みの力が尽きると、読み込み専用に変化してからこの状態に遷移するとされています。しかしこれを期待してバックアップなしで運用することは危険です。M.2.SSD(NVMe)では「自分自身が制御不能となる物理障害」を多数拝見しております。

発生頻度気持ち程度はS.M.A.R.T.による監視が有効ですが僅かな変化でもクラッシュに達する場合があります。
データ損失データが返せずエラーとなりますので損失につながります。また、統計的に使用頻度が高いセクタがやられますと損失の幅が大きくなりがちです。
危険度一度発生いたしますと少し増殖して止まるものもありますが、拡散する場合もあります。

リスクの高いミラーリング(参考:こちら)の場合であっても、この破損が先であれば、危機的な状況に陥る前に助かる可能性があります。 エラーが手に負えない程に積み重なる前に、コンピュータの動作が停止するためです。
※ S.M.A.R.T.による監視は、気持ち程度となりますが、この「読み書き不能セクタ」のみ有効と考えられます。ただし、S.M.A.R.T.が警告を発しましても、買って間もない場合は「誤報」の可能性が高いです。

再発読み込み不能セクタ [HDD, SSD]

「読み込み不能」を再発するセクタが、これに該当いたします。

読み込み不能セクタ発生(1度目) =>> 書き込み処理により復帰 =>>
以下の条件を満たすと、また読み込み不能に変化 =>> 書き込み処理により復帰 (繰り返し)

◆ 条件について
読み込み不能セクタ発生時、読み取り不能に化ける挙動が収まれば、それ以上のデータ損失は免れる事になります。しかし、これが繰り返されてしまいますと、確率的に「いつかは重要なデータが犠牲になる」状況になります。

読み込み不能セクタと同じく、自然に発生いたします。(経年劣化)
※ 一度書き込み終えまして、長時間を経過後、このセクタに化ける事があり、それが何度も再発してしまいます。
※ 再発には何らかの「きっかけ」が必要で今のところ電力不足(HDDの場合)を確認しております。この点より、常に電力不足で運用されている場合、この種類のセクタを既に抱えている可能性があります。
※ SSDの場合でこの症状を引き起こした場合は修復不能な故障です。 これは、不良セクタの修復(こちらの機能)を試みて成功したとしても、まともな動作は期待できない事を意味いたします。 すでに修復可能な条件を満たしていない点にご注目ください。乖離率は大きく、書き込み速度が出ていません。SSDの末期症状です。

発生頻度ビット腐敗(詳しくはこちら)
データ損失データが返せず、さらに拡散型(周辺まで巻き込む)へと悪化する場合が多々あります。このため、非常に大きな損失につながります。
危険度非常に怖いセクタです。

S.M.A.R.T.数値は正常を振舞っているが、壊れている場合が多く、それらが引き金となり大きな損失につながる危険性があります。
※ はじめの読み込み不能セクタは、範囲が自分自身または小規模ゆえ、その発見が難しく、知らないうちに起きる書き込み操作により元に戻っている事が多々ございます。
※ しかし、それらが再発し、拡散した瞬間に損傷範囲が大きく広がります。 結局、大部分に拡散した瞬間に、はじめて読み込みできない事に気が付き、データを戻すのが容易ではなくなります。日頃のバックアップが重要です。

拡散読み込み不能セクタ [HDD, SSD]

再発した読み込み不能セクタが拡散してドライブの機能を奪い取るセクタとなります。これらが生じた場合、既に物理的修復処置(クリーンルーム)なくてはデータサルベージ不可となります。
※ HDDの故障はヘッドクラッシュによる異音が一般的と思われておりますが、このような故障も多発しております。SSDの場合、この症状ではデータを引き抜くのが困難です。案外、壊れかけの場合はHDDの方が復旧しやすいです。

再発ではなく、一回目の読み込み不能から拡散する場合もあります。(確率としては低い)
※ 厄介な点といたしまして、拡散する直前までは正常に稼動できてしまう点です。確かに、拡散する前の読み込み不能セクタは一部分に限定して存在しておりますので、それに気が付く事ができません。


◇ 拡散読み込み不能セクタの具体例:「物理障害発生」までの経緯
1、使用中に突然、数個のファイルが読み出せなくなる。(読み込み不能、1つ目)
2、特に必要ではないファイルなので放置し気にせずに使用を再開。(読み込み不能を放置)
3、また使用中に、一つのファイルが読み出せなくなる。(別の個所が読み込み不能)
4、別のファイルをコピーした所なぜか成功。(書き込みにより、不能状態から復帰)
5、チェックディスクを実行しこちらも成功。(書き込みで復帰させた状態でエラーはない)
6、数日後に読み出しできないファイルが急に増加。近日中にバックアップすると決める。
7、翌日、電源を入れたら動作不能で停止。Windows自体が起動できなくなる。
8、ドライブを取り出し、外付けにしたがデータが一切見えない状態となる。


巡回冗長検査エラー(CRCエラー) [HDD, SSD]

コピーの際、動作が停止いたしまして「巡回冗長」を含むエラーが表示される場合です。複雑そうにみえますが、これは単に「該当セクタが読めないからコピーを停止」という意味となります。この原因といたしましては、読み込み不能セクタ(再発&拡散)、読み書き不能セクタが考えられます。
※ 拡散いたしますと物理的修復処置なくてはサルベージ不可となりますので、少しずつデータを退避させてください。

◇ 検査用ソフトウェア

これらを手作業で分類・解析するには、骨が折れる内容で、わざわざ対処することは難しいです。そこで、自動的に調査可能なソフトウェア(フリー v2 v3)をご用意いたしました。
※ Windows 11 / 10 / 8.1 / 8 / 7 / Vista / XP / 2000 に対応いたします。(v3は7以降です)
データ温存方式による検査ですので、データには一切影響ございません。ご安心ください。

※ SSD/NVMeの場合はv3をおすすめいたしております。従来の完全スキャンでは、状態をすぐに確定できないセクタが正常を振る舞う場合があるためです。

v2 [完全スキャン機能]による指標

● 読込不能(黄色):条件1を検出
● 読書不能(紫色):条件Aを検出
● 動作安定度:条件3~6、D~Fを検出
● 危険(赤色):総合的に考え、危険と判断されたセクタ。
この赤に限り、一つでもみつけたら「バックアップ&即換装」です。

v3 [統計スキャン機能]による指標

  • 下の動作指標がすべて、はじめ放たれた後、上に十分に伸びている: この点に加え、上の指標がオールグリーンであれば、問題ないことを示しております。
  • 下の動作指標が乱れながら下がっている: この場合、一度のスキャンで状態を確定できないセクタが多数検出されており、至急、バックアップおよび換装が必要です。