ただつらつらと日記が書かれていくようです。

タグ: 3ware

3wareの9650SEのWriteCacheはやっぱり速かった。

3wareの9650SEに3TBのHDDを2本つないで、RAID1のArrayを作って、しみじみとバックアップしていたDISKから書き戻している時に、ちょっとした軽い気持ちから(汗)RAID Arrayのinitializeを始めてしまった。データのコピーとinitializeが同時に走るので、ディスクのI/O的には割と苦しい状態になってしまったようで、データのコピーだけの状態からぐっと転送速度が落ちてしまった。…なんかちょっといらっと来る。

いろいろと調べてはみたものの、ArrayのVerifyなら止められそうだけど、initializeの止め方がわからなかった。このマシンをシャットダウンすれば止められそうだけど、それはそれでイヤなことが起きそうだし、と(汗)スローダウンしたまま、データのコピーを続けるといつ終わるかわからない。

なんせバックアップのHDDには膨大なファイルがある関係で(汗)さっさと終わらせたかったので、試しに、禁断のBBUなしの状態でWriteCacheをenableすることを決定。GUIの3DM2からさくっと(当然、サーバの電源落ちるとデータ飛ぶよとの警告画面は出たけど)onにしてみた。

すると、initializeしてないときとほぼ同じくらいの転送速度に戻った!…ような気がする。というか、このマシンではファイルの転送しかしてないので、体感でわかるくらいに劇的に改善された。これなら、予想された時間よりももっと短く転送が完了するかもと思いながらも、マーフィーの法則的にはこういう時に限ってマシンの電源が落ちるんだよなぁ…と半ば諦めながら進捗状況を監視中。

BBUナシなのがアレだけど、WriteCache、やっぱりいいなぁ。

3wareがLSIに売却されたらしい。

…今更、気がついた(汗)

さっき、3wareの英語サイトを眺めていたら、フッターがLSIになっていて、なんかの間違いだろうと思って、Goolgle先生に聞いてみたら…。

AMC flogs 3Ware storage | TheINQUIRER

AMCCが$20 millionと引き替えに、3wareをLSIに売却したって書いてあった。MegaRAIDシリーズのLSIと、9650SEなどの3wareの組み合わせは悪くないのかなぁとおも思ったりして。

とりあえず、LSIは「LSI Welcomes 3ware」だそうだ。

3ware 9650SEの先のHDDをsmartdに監視させてみた

とりあえず、9650SEの先は3つドライブが刺さっていて、smartdのヘルスチェックでこけたら、rootにメールを送るように設定してみた。/etc/smartd.confに以下の記述を追加。

/dev/twa0 -H -m root -d 3ware,0
/dev/twa0 -H -m root -d 3ware,1
/dev/twa0 -H -m root -d 3ware,2

…設定しおわって自己満足に浸っていたら、そもそもRAID Arrayは、3wareの3dmが監視していることに気がついて、あんまり意味ないじゃんってことで、orz。

3wareのナレッジベースにて:SEAGATEのハードディスクのファームウェアのバグ

久しぶりに3wareのナレッジベースを見てみたら、ちょっと困ったことが書いてあった。

Q15385

The Seagate SATA-2 Seagate Barracuda ES.2 family drives (NS) must have firmware AN05 or newer in order to be compatible with the 9690SA controller. Seagate firmware AN05 is newer than firmware SN05.

こりゃ、Seagate Barracuda ES.2で使われているファームウェアにバグがあった感じだなぁ(遠い目)。確か、Barracuda ES.2って、社内のどこかで見た記憶が…(涙)とりあえず、ファームウェアが入ったISOファイルの名前でググってみたら、Adaptecのサイトにも似たようなことが書いてあった。

Known Issues with Seagate Barracuda ES.2 SATA II Disk Drives

The array keeps failing drives. The controller error log shows continuous “aborted command” messages when using Seagate Barracuda ES.2 SATA II drives (models: ST31000340NS, ST3750330NS, or ST3500320NS). Is this a known issue with those drives?

症状としては、断続的にHDD側で受け取ったコマンドの処理をを中断してしまい、RAIDカードがHDD側の対応をドライブが逝ったと判断してしまうって感じだろうか。

渦中のSeagateのサポートコミュニティを見てみると、アナウンスが出てた。

ANNOUNCEMENT Firmware Issues

アナウンスのスレッドの書き込みから張られてたリンクを辿ると、こんなことも書いてあった。

Welcome, Seagate hard drive owners. A number of Seagate hard drives from the following families may fail when the host system is powered on:

Barracuda 7200.11

DiamondMax 22

Barracuda ES.2 SATA

SV35

Once a drive has failed, the data is inaccessible to users. Seagate has isolated this issue to a firmware bug affecting drives from these families manufactured through December 2008. Please use the following tools and instructions to determine if you have one of the affected products. If you do, we recommend that you update the firmware on the disk drive.

個人的には、Barracuda ES.2 SATAのファームウェアがバグってるのは痛い(…痛すぎる…)ことではあるけれど、Seagate的には、ファームウェアバグを抱えてるラインナップに「DiamondMax 22」とか「Barracuda 7200.11」が含まれているってのが、強烈に痛いんじゃないだろうか。「Barracuda 7200.11」って、アキバでもよく見かけたドライブだし、いろんなメーカーのPCに密かに入ってるような気がするし。しかも、一回、ダメになると、そのHDDのデータにアクセスできなくなるってのも深刻かも。

とりあえず、Firmware Recommendations for Seagate Drivesに載っていた対象製品リストを貼ってみたりして。

  • Barracuda 7200.11

ST31000340AS

ST31000640AS

ST3750330AS

ST3750630AS

ST3640330AS

ST3640630AS

ST3500320AS

ST3500620AS

ST3500820AS

ST31500341AS

ST31000333AS

ST3640323AS

ST3640623AS

ST3320613AS

ST3320813AS

ST3160813AS

  • Barracuda ES.2 SATA

ST31000340NS

ST3750330NS

ST3500320NS

ST3250310NS

  • DiamondMax 22

STM31000340AS

STM31000640AS

STM3750330AS

STM3750630AS

STM3500320AS

STM3500620AS

STM3500820AS

STM31000334AS

STM3320614AS

STM3160813AS

しかし、MaxtorのDiamondMaxってBarracudaとファームウェアを共通化してあったんだなぁ。まぁ、当然だといえば当然か(汗)

3wareの「9650SE」に刺さってるSATAドライブのSMART情報をちら見する。

3wareのRAIDカード「9650SE」に刺さっているSATAドライブのSMART情報が見られることがわかった。使ったOSはCentOS 5.2(x86_64)。なんとなく、RAIDカードの向こうにあるドライブのSMART情報って見えないような気がしていたんだけども。

で、SMART情報をチラ見するのに使うのはsmartctl。

普通のIDEドライブ(PATA)が刺さってるLinuxマシンだと、こんな感じでSMART情報が見られる(ま、ドライブがSMARTに対応していることが前提だけど)

smartctl -a /dev/sda

コマンドを実行すると情報がずらずらと出てくる。IDEドライブなんだから、なんとなく/dev/hdaのような気がするけど、コマンドの確認を使ったマシンがsdaになっていた。

で、余談だけど、IDEドライブがなんで/dev/sdaで見えるのか、ってことを調べてみたら、こちらに書いてあった。なるほどねぇ。

もとい。SATAドライブでSMART情報を見ようとすると、「-d ata」を付けてみたらってアドバイスされる。

In Linux, SATA disks accessed via libata are only supported by smartmontools for kernel versions 2.6.15 and above. Try an additional ‘-d ata’ argument.

そんなわけで、「-d ata」を付けると、普通にSMART情報がずらっと取得できる。

smartctl -d ata -a /dev/sda

で、3wareの9650SEに刺さっているSATAドライブの場合は、「-d」で指定するデバイス名が3wareになる。加えて、3wareのカードに刺さっているディスクは複数なので、どのポートに刺さってるドライブのSMART情報を見るかって番号を必要になる。例えば、9650SE上の0番ポートに刺さってるドライブを参照したい場合は

-d 3ware,0

って感じになると。

普通のドライブであれば「/dev/sda」とか指定していたデバイスの指定のところに、「/dev/twa0」を指定すると、晴れてSMART情報が参照できた。9650SEを複数枚刺していると、「/dev/twa1」とか「/dev/twa2」とか増えていくのかもしれない。で、結局、9650SEの0番目のポートに刺さってるSATAドライブのSMARTは、以下のようなコマンドで見られた。

smartctl -d 3ware,0 -a /dev/twa0

ま、SMART情報が見られたところで、温度とか再割り当てセクタの数など、いくつか項目しか理解できないけど、見られないよりはマシかな…ということで。