Introduction of Statistical Processing
統計処理の導入

Statistics is a method used for predicting future events. For example, flipping a coin to see if it lands on heads or tails. If the coin is unbiased, the probability of landing on either side is fifty-fifty, and if you keep flipping it, the probability will converge to this fifty-fifty ratio, which is intuitively understandable.
先を読むのに使われる手法として統計がございます。例えばコインを投げて表または裏になるかです。歪みのないコインなら表または裏の確率は半々ですから投げ続けるとその確率は半々に向かっていくのが感覚的にもわかります。

Population and Sample, Then Statistics
母体と標本 そして統計

The event of an unbiased coin having a fifty-fifty chance of landing on heads or tails is the population, and each result of the coin flip is called a sample. If we knew the population from the beginning, it would be easy, but in reality, it’s the opposite. We perform various analyses to understand this population. These analyses are called statistics.
歪みのないコインの表または裏の確率が半々になるという事象が母体で投げた各結果を標本と呼びます。このようにはじめから母体がわかっているのならよいのですが実際には逆です。この母体を知るために多角的な解析などを行います。そしてその解析を統計と呼びます。

Law of Large Numbers: The More You Try, The Closer the Sample Gets to the Population
大数の法則 良くも悪くも数打てば標本は母体へ

The intuitive feeling mentioned at the beginning is firmly established as the Law of Large Numbers. Now, about data recovery. As the amount of data increases, the number of sectors that fit as the smallest unit becomes enormous (in the billions to trillions). Therefore, following the Law of Large Numbers, the recovery results will conform to the population. Hence, if the quality of the population is poor, the recovery rate will not improve.
はじめに書きましたあの感覚なんとなくではなくしっかりと大数の法則として定められています。そこで、データ復旧です。データ量が増加すると最小単位として収まるセクタの数が莫大(億から兆単位の数です)になります。よって、この大数の法則に外れず、復旧結果は母体通りになります。そのため、母体の出来が悪いと復旧率も上がらないという流れです。

About the Number of Attempts, Which Means the Number of Samples
手数について すなわち標本の数です

In the analysis of data recovery, the concept of ‘number of attempts’ is a very important element. For example, even when acquiring the same data, there are multiple methods available. If the drive is normal, ‘either method is fine (which is why the file system works)’. However, in the field of data recovery, it is necessary to prioritize the method with fewer attempts. The word ‘preferentially’ is used here because, even if a method with fewer attempts has a higher risk, sometimes a method with more attempts is chosen. This judgment becomes more complicated as drives increase in capacity, making manual data recovery work more difficult.
データ復旧の解析では「手数」の考え方がとても大切な要素となっております。例えば同じデータを取得する場合であっても複数の方法が存在するものとします。この場合、正常なドライブならば「どちらでもいい(だからファイルシステムが成立)」となります。しかしデータ復旧の現場では「手数」が少ない方を優先的に選ぶ必要があります。ここで「優先的」としたのは「手数」が少ない手法であっても、リスクが高い場合にはあえて「手数」が多い方を選択する場合があるためです。この判断がドライブが大容量化するほど複雑化してしまい、それゆえに現在のデータ復旧作業については「手作業」では難しくなってきております。

Bad Sectors That Become Fixed Are Easy to Handle
固定化される不良セクタなら扱いは容易です

Even if bad sectors occur, if they become ‘fixed’, it is easy to handle them. The avoidance method for bad sectors involves statistically and probabilistically inferring the position of these bad sectors from similar drives, then preparing in advance, setting these areas as scan ranges, and fixing the same rules within these ranges to avoid bad sectors.
不良セクタが発生した場合であっても一度発生した不良セクタが「固定化」されるなら不良セクタの回避方法については、その不良セクタの位置を同じ系統のドライブから統計的ならびに確率的に推測のち事前に準備を行い導かれる区間についてそれらをスキャン区間に設定し、その区間内を同じルールに固定化して不良セクタを避けることを実現いたします。

About Handling Bad Sectors
不良セクタの対処方法について

Consider the case where bad sectors occur at ‘200’, ‘1200’, ‘34561’. If they are fixed, we first determine ‘where these sectors are located’. Then we check the file system. Next, we find that these are frequently occurring in the ‘MFT’ called the ‘Master File Table’. The position of this ‘Master File Table’ can be determined from the sector called ‘BPB’ in ‘one move’, so we set it as the ‘range’ and scan the entire ‘MFT’ using a scan method that assumes bad sectors exist there. By the way, about the necessity of ‘MFT’.
不良セクタが「200」「1200」「34561」で発生している場合を考えてみます。固定化されている場合、基本的にこれらのセクタの位置が「どこに存在するのか」を判断いたします。次にファイルシステムを確認いたします。そしてこれらが「MFT」と呼ばれる「マスターファイルテーブル」に多く発生している点をつきとめます。そこでこの「マスターファイルテーブル」の位置は「BPB」と呼ばれるセクタから「一手」で判明できますから、そこを「区間」に設定して、このような不良セクタが存在するとみるスキャン方法で「MFT」全区間をスキャンします。ところで「MFT」の必要性です。

The MFT contains ‘file names’, ‘positions to the files’, and ‘fragmentation of the actual files’ and is ‘essential (important)’. Therefore, the option to ‘avoid’ it does not exist. It is a place that must be scanned using all available techniques. On the other hand, if the bad sector was in the ‘Index Buffer’. This ‘Index Buffer’ is an index to reduce the number of operations for accessing the file system. It enables ‘random access’, but in data recovery, it is a low priority, so if there is even one bad sector in this area, it is avoided.
MFTには「ファイル名」「ファイルまでの位置」「実ファイルの断片化性」が含まれ「必須(重要)」です。そのため「避ける」という選択肢はありません。あらゆる技術を駆使して、必ずスキャンする場所となっております。逆に、その不良セクタが「インデックスバッファ」だった場合です。この「インデックスバッファ」はファイルシステムへのアクセスの手数を減らすためのインデックスです。これにより「ランダムアクセスが実現」できているのですが、データ復旧では、優先度は低いため、ここに不良セクタが一つでも存在する場合は「避ける」仕組みです。

The method involves scanning by distinguishing between necessary sectors and unnecessary sectors.
必要なセクタ、そうではないセクタ、それらを区別してスキャンする方法となっております。