ただつらつらと日記が書かれていくようです。

タグ: HDD (1ページ目 (2ページ中))

HDDの故障率とか

Gigazineが「HDD約3万5000台を運用した実績からSeagate製品の圧倒的壊れっぷりが明らかに」って記事で紹介してたのが、Backblazeというオンラインストレージ屋さんのブログ。で、そのエントリーのタイトルは「Hard Drive Reliability Update – Sep 2014」。

HDDベンダーごとに故障率を出している、インフォグラフィックスが掲載されていた。…ご丁寧に、このタグで、このイメージをシェアできるよって書いてあったので、素直に貼るとこんな感じ。

Hard Drive Failure Rates by Model

いやー、Seagateさんの故障率の高さが目立つなぁという感じですが、Seagateといえば、ファームウェアのバグの問題が世間を賑わせたわけですが、その頃のモデル(Barracuda.11シリーズ)を使ってたら故障率は高いだろうと思って調べてみたら、SeagateのラインナップのBarracuda.12シリーズでも故障率高いから、うーんという感じ。

じゃぁ、BackblazeはSeagateだけ数多く使っててHGSTとか数が少なければ、故障率も正しくは出てこないよね!と思ったら、別の記事「What Hard Drive Should I Buy?」によれば、Backblazeで使っているHDDはSeagateとHitachiでそれぞれ12,000台ずつって感じだから、特にSeageteが数多いわけでも、HGSTが少ないわけでもないらしい。

で、この1月の記事では、こんな結論を出している。

We are focusing on 4TB drives for new pods. For these, our current favorite is the Seagate Desktop HDD.15 (ST4000DM000). We’ll have to keep an eye on them, though. Historically, Seagate drives have performed well at first, and then had higher failure rates later.

Our other favorite is the Western Digital 3TB Red (WD30EFRX).

まぁ、WesternDigitalのRedシリーズも使うけど、Seagateも長く使うと故障率上がるものの、最初は性能いいしなぁということらしい。RAID等で保護されていれば故障した際にはHDD交換すれば済むけど、堅牢だけど、遅いHDDを並べても性能がでるわけでもないしなぁ。

そんなHGSTの3.5インチHDD事業は東芝に買収されたことを思い出すと、Toshibaの故障率の推移はどうなっていくのか、ちょっと興味深い。今後もbackblazeにはHDDの故障レポートを公開して欲しいな、と。

3wareの9650SEのWriteCacheはやっぱり速かった。

3wareの9650SEに3TBのHDDを2本つないで、RAID1のArrayを作って、しみじみとバックアップしていたDISKから書き戻している時に、ちょっとした軽い気持ちから(汗)RAID Arrayのinitializeを始めてしまった。データのコピーとinitializeが同時に走るので、ディスクのI/O的には割と苦しい状態になってしまったようで、データのコピーだけの状態からぐっと転送速度が落ちてしまった。…なんかちょっといらっと来る。

いろいろと調べてはみたものの、ArrayのVerifyなら止められそうだけど、initializeの止め方がわからなかった。このマシンをシャットダウンすれば止められそうだけど、それはそれでイヤなことが起きそうだし、と(汗)スローダウンしたまま、データのコピーを続けるといつ終わるかわからない。

なんせバックアップのHDDには膨大なファイルがある関係で(汗)さっさと終わらせたかったので、試しに、禁断のBBUなしの状態でWriteCacheをenableすることを決定。GUIの3DM2からさくっと(当然、サーバの電源落ちるとデータ飛ぶよとの警告画面は出たけど)onにしてみた。

すると、initializeしてないときとほぼ同じくらいの転送速度に戻った!…ような気がする。というか、このマシンではファイルの転送しかしてないので、体感でわかるくらいに劇的に改善された。これなら、予想された時間よりももっと短く転送が完了するかもと思いながらも、マーフィーの法則的にはこういう時に限ってマシンの電源が落ちるんだよなぁ…と半ば諦めながら進捗状況を監視中。

BBUナシなのがアレだけど、WriteCache、やっぱりいいなぁ。

古いPCの中からMaxtorのDiamondMaxが出てきた。

こんなことを書くと、年をとったなぁと思うんだけども…。えー、昔々、MaxtorというHDDメーカーがありました(汗)*1

Maxtorは、PC向けのIDEのHDDを作っていて、その昔、Windows2000が主流だった時代なんかはよくお世話になっていて、「DiamondMax」というシリーズで売られていたのも、今となっては遠い昔の記憶。で、2005年頃、そのMaxtorがSeagateと合併することに…というか、SeagateがMaxtorを買収して、DiamondMaxのシリーズも終息することになったわけで、今ではもう全く見かけることのない、「Maxtor」の「DiamondMax」シリーズ。

今日、古いPCを破棄するべく、HDDのデータを消そうと思って、PCのケースを開けてみたら、ここに隠れていたのか「Maxtor」の「DiamondMax」!

懐かしいような気もしつつ、こんなPCをいつまで後生大事に保存していたんだかという気もしつつ、取り外して別のPCに繋いでみたら、ちゃんとスピンアップしたので、ddでアタマから0を上書きしているところ。IDE(PATA?)なんて接続できるPC自体がなくなってきているので、保存しててもしょうがないので、このDiamondMaxは破棄してしまうけれど、なんとなくもったいないような気がしないでもない。

f:id:y_fudi:20131011202228j:image

*1:読み方が「マックストア」らしいということを知るまでは「まくすたー」と呼んでいたのは個々だけの秘密

badblocksにてHDDの検査中。

ddを使ってドライブの隅から隅まで読み書きのテストをしていたHDDのSmartの「Current Pending Sector Count」に2が記録されていた。んで、dmesgにはこんな感じでエラーが記録されていた。

sd 5:0:0:0: [sdb] Unhandled sense code
sd 5:0:0:0: [sdb] Result: hostbyte=DID_ERROR driverbyte=DRIVER_SENSE
sd 5:0:0:0: [sdb] Sense Key : Hardware Error [current]
sd 5:0:0:0: [sdb] Add. Sense: No additional sense information
sd 5:0:0:0: [sdb] CDB: Read(10): 28 00 03 ff 8b 00 00 00 f0 00
end_request: I/O error, dev sdb, sector 67078912
__ratelimit: 20 callbacks suppressed
Buffer I/O error on device sdb, logical block 8384864
Buffer I/O error on device sdb, logical block 8384865
Buffer I/O error on device sdb, logical block 8384866
Buffer I/O error on device sdb, logical block 8384867
Buffer I/O error on device sdb, logical block 8384868
Buffer I/O error on device sdb, logical block 8384869
Buffer I/O error on device sdb, logical block 8384870
Buffer I/O error on device sdb, logical block 8384871
Buffer I/O error on device sdb, logical block 8384872
Buffer I/O error on device sdb, logical block 8384873

うーむ、Buffer I/O error。なんか嫌な予感がするので、badblocksに切り替えて(今思えば、最初からbadblokcsを使っておけばよかったな)破壊検査を実施。これは時間がかかりそうだ。

HDDのエージングってどうしたものか。

新たにサーバを構築しようとなって、HDDを調達してみたものの…これ、どうやってエージングするのが正しいのだろうか、と考えると、結構面倒くさいことになりそうな気がしてきた。

例えば、ddでディスクの隅から隅までをゼロフィルしたとして、その間に書き込めないセクタが見つかればエラーを検出してくれそうな気がする。一方で、読み込みの方は、例えば、ifに検査対象の/dev/sdXを指定することで、/dev/sdXから読み込んで、/dev/nullに書きこんであげれば(…といっても電子空間の狭間に消えて行くわけですが)、また、HDDからの読み込み中にddが読み込めないセクタに直面したら、きっとエラーが検出されるだろう(てか、検出して欲しい)

一応、テストにはなりそうな気がしてくるものの、1回、隅から隅まで読み書きしただけでOKとするのも心許ないような気がするので、読み書きを何回かくりかえすことになりそうだ。しかも、この手のテストは、隅から隅までHDDを舐め回すので、1本のHDDを処理するのにさすがに時間がかかりそうだ。しかも、RAID1+Hotspareなサーバが2台だから、テストすべきHDDは6本。orzあとは、1台のPCに複数台のHDDを接続して、同時並行でテストするしかないかと…。

WesternDigitalの「WD10EADS」 の調子が悪そう。

ま、いつものことなのでどうしたってことでもないけれど、古いLinkStationに使っていた、WesternDigital製の「WD10EADS」が認識されなくなった。というか、動作音から察するにどうも上手くスピンアップしなくなったようであった。

まー、2009年に交換したドライブなので2年とちょっとでダメかーということで、素直に諦めてSeagate製のBarracudaを買ってきて、ゴニョゴニョしながらHDDを交換してファームウェアをインストールして、ひととおりLinkStationとして動く状態まで戻してみた。で、壊れたディスクと知りつつもそこから、データをレストアして、新しくなったLinkStationに書き戻すことにした。

USB-SATAアダプタを使って、Ubuntuマシンに接続してみたら、なんてことなくスピンアップ。正常に認識されて、SMB経由でNASにファイルが無事に書き戻された。…なんだ、別に壊れてないじゃん。

なんとなーく最初の故障と思しき症状の背景を考えてみた。まずは、HDD側の不良の可能性。ま、あり得なくはないものの、外に引っ張り出した途端に、普通にスピンアップしてデータを読み出せたのはどうなんだろう。確かに、Western Digitalが省電力を売りにして発売した「Cavier Green」シリーズの最初の方のHDDだから、自動ヘッド退避などでややこしいことをしているらしく、なんとなく故障しやすいHDDだろうというのは想像がつくのだが…。どうもなぁ…。また、LinkStationの方も、どうやら使っている電解コンデンサの寿命が短いらしく、コンデンサのアタマが膨らんじゃっているようなこともあり、そうなるとHDD周辺で何かが起こるらしい。そして、200円分くらいのコンデンサを秋葉原で手にして、ハンダゴテを使ってコンデンサを交換すると治るらしい。

しかし、LinkStationの電解コンデンサの不良があったとすると、新しいHDDに交換してもダメなはず、、、だけど、今のところ、SeagateのBarracudaは普通に動いているようにみえる。。どうもHDDもLinkStationも怪しい気がするが、それぞれを組み合わさないと自体が起きないようである。

とりあえず、LinkStationから引っ張り出したWestern Digitalの「WD10EADS」を少しテストしてみよう。なんかエラーが出てくれれば、RMAでシンガポールあたりに返却して終了にできるんだけども。

TimeMachine向けにWesternDigitalのCaviarGreenを買ってみた。

先日、思いつきでMacBook Airを購入してみたものの、よく考えたら、バックアップを取ってなかった。しかも、MacOSXには、Leopardから「TimeMachine」っていう秀逸ななバックアップツールが付属しているにも関わらずである。さて、「TimeMachine」でバックアップを取るか、と思い立ってはみたものの…手元にたっぷりと空き容量が余っているHDDなんてなかった(汗)とりあえず、さっさとバックアップを取りたいだけなので、できればお金をかけたくない。

うーむ。

そういえば、うちの古いLinkStationはHDDを換装してあったのでバックアップに使えるくらいの空き容量はあったのでNASに保存することの検討を開始。しかし、調べてみたら、LionからTimeMachineに仕様変更があったらしく、バックアップ先のNASがAFP(Apple Filing Protocol)3.3に対応している必要があるらしいことがわかった。AppleのTimeCapsuleとかならOKっぽいし、Buffaloの新しいNASもファームウェアアップデートなどで対応しているらしい。一方、ウチの古いLinkStationが対応しているはずもなく、NASにバックアップする試みは終了。(SnowLeopardあたりまでは、NFSが使えるNASにはTimeMachineでバックアップできてたらしいんだけどなぁ…)

もうちょっと調べてみたところ、FreeNASの8.0.1RCからAFP3.3に対応しているようだった。つまり、LinkStationに引導を渡して、FreeNASあたりで適当にNASを構築すれば、TimeMachineのバックアップ先NASとして使えるわけだ。うちにある使ってないPCというと、古いThinkPadしかないわけで…なかなかNASには使いづらい(ま、がんばってThinkPadをNASに使うとすると、CardBusにeSATAのカードでも指すとかする感じだろうか。それもチップが対応してないと終了っていう…なかなか厳しいパターンだ)。そんなわけで、TimeMachineに使える、新たなNASの構築プロジェクト終了。。。

結局、バックアップ用のHDDをMacBook Airに挿して、そこにTimeMachineでバックアップを取るのが手っ取り早いという結論に至った。当然、Thunderboltの対応機器がないわけで、USB2.0のUSB-HDDしか使えない。

あぁ、もうこうなってきたら、秋葉原でバルクなHDDとケースを買ってきて、それでいいだろう。

で、買ってきたのがWesternDigitalのCaviarGreen。容量が2.5TB。無駄に容量がある。しかし、2.5TBの容量がありながら、7000円を切っていたのがなんだか隔世の感。とりあえず、安いケースと一緒に買ってきた。

f:id:y_fudi:20110919173016j:image

その後、普通にUSB-HDDとして組み立てて、MacBook Airに挿して、HFS+のジャーナル付きでフォーマットしたら、TimeMachineでバックアップ先に選ぶことができたので、TimeMachineに後は任せておいた。

HITACHIのHDDを買ったらリテールパッケージだった。

社内の開発用マシンのHDDを交換することになったので、とりあえず、HITACHI製のドライブを買ってみた。

プチプチに包まれたバルクドライブが届くつもりで待っていたら、届いたのは、なんかもう「the リテールパッケージ」って感じの箱入のハードディスク。

HITACHIのDESKSTARリテールパッケージの外観

外箱には、ご丁寧にHITACHIのロゴまで入っていて、ちゃんと「inspire the next」って書いてあったけど…ここまでする意図はなんだろうという感じ。バルクドライブのまま流通させたほうが安そうだし、こういうところにお金をかけて値上げされても辛いというか、こういうところ値上げされると、他のベンダーのHDDを買いそうになるのは私だけだろうか。(…ところが、こんなしっかりしたパッケージのHITACHI製ドライブがむしろ安かったのはどういうことだろう…)また、外箱には中に入っているHDDの型番を書いていなかったので、HDD好きな人にとっては型番を選べないのも辛いかもしれない。

で、外箱を開けて、中のHDDを引っ張り出してみると、HDDが箱の中でしっかり動かないように梱包されていて、かさ張るけれども、まぁ、これはこれでいい感じ。

HITACHIのDESKSTARリテールパッケージの中

日本語で書かれた保証書が付いていた。お買い上げ日から3年間保証らしい。ただ、SeagateのRMAなんかと違って、HDDが保証期間内に故障したら、お買い上げ店に持ち込んで…ということになってるのが面倒くさそうだ。普通に、RMA方式でいいじゃないかと思うのだが…。

もとい。こんなしっかりしたパッケージとバルクドライブを併売するのもナンセンスだろうから、日立が保証を付けてリテールパッケージ売りを始めるということは、そっち方面にシフトしていくということだろうなぁ。…てか、いつから始めたんだろう(汗)

SeagateのHDDでRMAを使ってみた。

RMAってのは、Return Merchandise Authorizationの略らしく。要するに、SeagateのようなHDDメーカー自身が返品保証を付けて製品を流通させ、製品が故障するなどした場合に、ユーザーから直接HDDメーカーに返品することで代替製品を受け取れる…といった制度っぽい。ただ、Seagateの場合、返品する部分の輸送費はユーザーが負担しなくちゃいけないらしい。代替品の発送にかかる輸送費は負担してもらえる。

…で。

今回、社内のPCで使っていた「ST3500320AS」(ファームウェアバグで問題になったBarracuda 7200.11の500GB)は、ファームウェアの更新済みにも関わらず、使用開始から1年も経過していないのに(かつ、普通のPCの使い方しかしてないのに)に不良セクタ(代替処理済みセクタ、回復不能セクタ)が、かなりの数が発生していて、なんとなくこりゃまずそうだなと思い、交換用のHitachi(さすがに次もSeagateを選ぶ勇気はなかった)のドライブを買ってきて交換しておいた。

で、PCから外した、不安の残るBarracudaを捨てずに、RMAでSeagateに交換してもらうことにした次第。

まずは、Seagateのサイトで申し込み。トップページから「保証サービス」に飛んで、「ゲスト ユーザでドライブを返品する」に移動すると、返品するHDDのシリアルナンバーなどが聞かれるので入力し、保証が有効であることを確認。で、発送元の情報を入力すると、国内に送るか、シンガポール(…だったかな)に送るか選べるので、国内を選択。

で、私の場合は、SeagateのHDDを買ったときのブリスターパック(HDDを包むプラスチックケース)が置いてあったので、それで1段目の梱包とした。で、さらに、小さな段ボールに、ブリスターパック入りのBarracudaと、その周りに緩衝材を詰めて宅急便で返送完了。一応、RMA番号とSeagateのHDDが入っていることを品物欄に書いておいた。発送先は、成田にあるUPSの拠点っぽかった。

返送してしばらくは何の反応もなかったけれど、5日後にメールが届いた。タイトルは「Seagate RMS Receipt Acknowledgement」。どうやら、代替品をシンガポールから発送したっぽい。そのメールの中に、Tracking Numberが書いてあったのと、どうやらUPSで送られてくるらしいということで、UPSのサイトから代替品のHDDを追跡してみた。

UPSのサイトによれば

  1. シンガポール(出発)
  2. フィリピン(経由)
  3. 成田(到着)

という経路。「おお、本当に国際便だぁ」と、なぜかコーフンしてしまった(汗)

で、届いたのは、発送したときの小さな段ボールと比べると4倍くらいの大きさの段ボール。緩衝材も私が使ったような安物ではなくて、スポンジだった。でも、入ってるのはHDD一個。

f:id:y_fudi:20090709112600j:image

f:id:y_fudi:20090709112700j:image

で、届いた代替品をよく見てみると「Certified Repaired HDD」だった。うっかり新品を期待してしまったが、修理品とはいえ、きっと不良セクタがないドライブなんだから、まぁ、よしとしようかと(もともとバルクドライブで買ってるってのもあるし、HitachiだとRMA制度がないっぽいし。)

3ware 9650SEの先のHDDをsmartdに監視させてみた

とりあえず、9650SEの先は3つドライブが刺さっていて、smartdのヘルスチェックでこけたら、rootにメールを送るように設定してみた。/etc/smartd.confに以下の記述を追加。

/dev/twa0 -H -m root -d 3ware,0
/dev/twa0 -H -m root -d 3ware,1
/dev/twa0 -H -m root -d 3ware,2

…設定しおわって自己満足に浸っていたら、そもそもRAID Arrayは、3wareの3dmが監視していることに気がついて、あんまり意味ないじゃんってことで、orz。

« Older posts