ハードディスクの故障は予測可能か?

関連記事:ハードディスクに関する記事のINDEX
ソコンは何年か使い続けていると、ときに妙な動作をするようになります。OSの起動に失敗したり使用中のソフトが異常なフリーズ*1を起こしたり…。こうなった時点でハードディスクのダメージは相当深刻なものになっていると考えられます。完全に起動しなくなるまで秒読み段階ですので、すぐにバックアップをしてハードディスクを新品のものと交換しましょう。
ちなみに右の写真はYou Tobe にある動作中のハードディスクの中身の動画です。ヘッドの激しい動きを見ていると、いつ壊れるかわからないということが少しは実感できるかもしれません。

はクラッシュ(故障)する前兆をつかむことは可能なのでしょうか?Gigazineのサイトに興味深い記事が掲載されています。

Googleによると、ハードディスクは温度や使用頻度に関係なく故障する

今まで一般的に信じられてきたハードディスクにまつわる常識として、

    • 温度が高いと故障しやすくなる
    • アクセス頻度が高いと多く動くため、故障しやすくなる

というのがありましたが、Googleが10万台以上の民生用ハードディスクドライブを使用した調査を行った結果、温度やアクセス頻度に関係なく故障することが判明したとのこと。

そればかりか、ハードディスク障害の早期発見、あるいは故障の予測を目的として搭載されている「S.M.A.R.T.(スマート)」の値から得られるいつ故障するかどうかの予測もほとんど関係なかったそうです。

Googleはこれらの実際のデータによる結果に基づき、既存のSMART値から新しい故障予測方法を見つけ出すことが必要である、と結論づけています。

〜略〜

ただし、ハードディスクの温度が50度を超えるような環境であれば、故障率は如実に上昇しています。これはハードディスクのメーカーも推奨していない温度なのでさすがに当然か。

また、SMART値から得られる故障予測日数についてはほとんど参考にならなかったが、いくつかの値に注目すると有意な関連性が認められており、特にScan Errorは割と関連が高く、Scan Errorが出てから60日以内に故障する確率は、Scan Errorが出ていない場合の実に39倍。

とはいうものの、Googleで故障してしまったハードディスクの大半は何のSMART値によるエラーも出していなかったそうで。いわゆる突然死ですね。

〜略〜

引用元:Gigazine http://gigazine.net/index.php?/news/comments/20070219_disk_failures/

れを読むと、パソコンの中心的かつ重要な役割を担うハードディスクが、過大な負荷や過酷な環境下でなくても何の前触れもなく突如動作しなくなる可能性の高いことがわかります。他の部品であれば新品に差し替えれば済むのですが、ハードディスクはともすると何時間もかけてそこにOSや必要なソフトのインストールや設定を施した環境を構築しなければ、元のパソコンとして使うことはできません。そしてもし重要な書類を作成中であっとしたら、それまでも最初から書き直さなければならないこともあるのです。*2

えば、東京から大阪に出張するために乗った新幹線が、穏やかな天気の下、何も事件や事故がないにもかかわらず線路の上で何時間も止まってしまうようなものです。車内に閉じ込められた私たちに、車内アナウンスで『原因不明のモーターの故障で停止しております、一度東京まで戻って別の車両に乗り換えてください』などと言われたらどう感じますか?悪天候が原因でそうなってしまったのなら、『仕方ないか〜』となりますし、悪天候交通機関に悪影響を与えるということを容易に予見できるので、出張する日を変更したり前日に出発することも考えられたでしょう。

客を乗せた新幹線が突然故障するなんて公共の交通機関ではあってはならないことですが、パソコンは前ぶれもなく突然故障する、それがかなり高い確率でそうなるような仕組みのまま今も世界中で使われているのです。新幹線もパソコンも無くてはならない人が多くいるこの世の中で、パソコンはあまりにも不完全な電子機器だと感じるのは私だけでしょうか。人が作ったものだから完全なものはないにせよ、家電製品のように扱われるようになったパソコンは、2007年の今日も未だに前時代的な構造であるのは驚きにも値します。その原因は一時期の低価格化を標榜してきた業界の姿勢にあるのか、それを選んできた私たち消費者にあるのかはまた別のところで…。

話休題、少しでもハードディスクの故障の前兆を捕らえて、クラッシュする前にハードディスクを交換できたらそれに越したことはありません。そこで気になるのが上記引用にあったScan Errorです。これって何でしょうか?そしてSMART値とは何を意味するものでしょうか?ウィキペディアの記事にその概要と検査項目について記されています。

Self-Monitoring, Analysis and Reporting Technology(セルフモニタリング・アナリシス・アンド・リポーティング・テクノロジー)、通称S.M.A.R.T.(スマート)は、ハードディスクドライブの障害の早期発見・故障の予測を目的としてハードディスクドライブに搭載されている機能である。この機能は、各種の検査項目をリアルタイムに自己診断し、その状態を数値化する。ユーザーはその数値を各種のツール(後述)を用いることで知ることが出来る。全ての故障を予期することは出来ないが、安定した利用環境における経年劣化による故障を知るには非常に有効である。

2005年現在においては、製造されている殆どのハードディスクドライブにこの機能が搭載されている。

引用元:http://ja.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology

こには「Scan Error」という項目は見当たりません。「Off-Line Scan Uncorrectable Sector Count」に唯一Scanの文字を見出せます。その内容は…

オフラインスキャン時に発見された、回復不可能なセクタの総数。この値が増加する場合は、磁気ディスクの表面に明確な問題がある。

引用元:http://ja.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology

れでは、SMART値なるものを取得して故障予測日を算定するフリーソフトがあるのでそれをインストールしてみましょう。
続きはこちら→「ハードディスクの交換時期を見極める

*1:エラーダイアログを出さないでフリーズして、マウスやキーボードに一切反応しなくなる などetc

*2:無停止のサーバーコンピュータはRAIDを使って複数のハードディスクで同一のデータを保持して、どれか一つハードディスクが壊れても動作しなくなることがないような仕組みになっている。私たちの使うパソコンではコストが掛かり過ぎて一般的ではないが、一部のパソコンに搭載されているものもあり、突然のクラッシュに大いに困った人にはお奨めの逸品かもしれません 関連サイト:http://plusd.itmedia.co.jp/pcupdate/articles/0503/24/news034.html