| ■ 【ぷろじぇくと ぞうさん】 〜E-Bananaサーバ 構築日記〜
|
第8日目:花子の「ありがとう!」〜「ささやき作戦」(その3)〜
|
どうも、('A`)です。
今日は東京で雪が降ったとニュースで見ましたが、皆さん転んだりして怪我していませんか?
私のところは雪まつりが近づいていて雪像が急ピッチで作られていますが、なんだか今年は
雪が不足しているみたいで、まだまだかかりそうです。
さて今回は花子のささやき作戦の最終回となります。
今度こそRAID再構築&ホットスワップの作成を成功させます。
前回は引き抜くHDDを間違えて余計な再編成を行なってしまいましたが、それも終って
「ぞうさん」のRAID状態は以下の様になりました。
//banana3000> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
---------------------------------------------------------------
u0 RAID-6 DEGRADED - - 64K 6053.47 ON OFF
u1 RAID-6 INOPERABLE - - 64K 6053.47 OFF OFF
u2 RAID-6 INOPERABLE - - 64K 6053.47 OFF OFF
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 465.76 GB 976773168 6QG15YS8
p1 DRIVE-REMOVED - - - -
p2 OK u0 465.76 GB 976773168 6QG11Z7M
p3 OK u0 465.76 GB 976773168 6QG15ZP5
p4 OK u0 465.76 GB 976773168 6QG16SGK
p5 OK u0 465.76 GB 976773168 6QG15EYR
p6 OK u0 465.76 GB 976773168 6QG16SAM
p7 OK u2 465.76 GB 976773168 6QG14N85
p8 OK u0 465.76 GB 976773168 6QG12MYG
p9 OK u0 465.76 GB 976773168 6QG12NSB
p10 OK u0 465.76 GB 976773168 6QG15YP4
p11 OK u0 465.76 GB 976773168 6QG14N7G
p12 OK u0 465.76 GB 976773168 6QG10SS5
p13 OK u0 465.76 GB 976773168 6QG14N66
p14 OK u0 465.76 GB 976773168 6QG14N34
p15 OK u0 465.76 GB 976773168 6QG10PGX
//banana3000>
|
上のモニタで判ることは以下の3つです。
・RAID 6本体(Unit 0)では14本しか無い状態
・前回の引き抜きの過程でUnit 1という余分なユニット(実体は無し)が存在する
・ホットスペアのHDD #7(Unit 2)はまだちゃんと動いていない
(^_^;):「さて、、、、ここから元に戻すか!」
('A`):「これからBrian( ^ω^)に交換用のHDDをHDD #1に取り付けてもらいます。」
その前に余分なユニットUnit 1をRAID管理システム(3dm2)を使って削除しよう。
ブラウザで3dm2のTOPページにアクセスし、Administrator(管理者)でログイン。
そして[Management] > [Maintenance]を選択して、以下の画面を表示させる。
(下の画面は当時の内容を表していませんが、こんな感じの画面です。)

Unit 1 と書かれた横のチェックボックスにマウスでチェックをつけてから
「Delete Unit」のボタンをクリックする。ちょっとドキドキ。
すると、Unit 1が消えて一瞬立ってからUnit 2として表示されていたHDD #7の
ユニット名がUnit 1となった。
//banana3000> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
---------------------------------------------------------------
u0 RAID-6 DEGRADED - - 64K 6053.47 ON OFF
u1 RAID-6 INOPERABLE - - 64K 6053.47 OFF OFF
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 465.76 GB 976773168 6QG15YS8
p1 NOT-PRESENT - - - -
p2 OK u0 465.76 GB 976773168 6QG11Z7M
p3 OK u0 465.76 GB 976773168 6QG15ZP5
p4 OK u0 465.76 GB 976773168 6QG16SGK
p5 OK u0 465.76 GB 976773168 6QG15EYR
p6 OK u0 465.76 GB 976773168 6QG16SAM
p7 OK u1 465.76 GB 976773168 6QG14N85
p8 OK u0 465.76 GB 976773168 6QG12MYG
p9 OK u0 465.76 GB 976773168 6QG12NSB
p10 OK u0 465.76 GB 976773168 6QG15YP4
p11 OK u0 465.76 GB 976773168 6QG14N7G
p12 OK u0 465.76 GB 976773168 6QG10SS5
p13 OK u0 465.76 GB 976773168 6QG14N66
p14 OK u0 465.76 GB 976773168 6QG14N34
p15 OK u0 465.76 GB 976773168 6QG10PGX
//banana3000>
|
んで、( ^ω^)と交信開始。
('A`):「( ^ω^)、に交換用のHDDをHDD #1に取り付けて。」
( ^ω^):「OK!今からHDD #1に新品のHDDを挿すよー。」
そして、、、
( ^ω^):「HDD挿してみたけど、状態はどうなってる?」
('A`):「管理ツールで見てみるよ。ちょっと待ってて。」
管理ツール(今度はtw_cli)で見てみると、
//banana3000> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
---------------------------------------------------------------
u0 RAID-6 DEGRADED - - 64K 6053.47 ON OFF
u1 RAID-6 INOPERABLE - - 64K 6053.47 OFF OFF
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 465.76 GB 976773168 6QG15YS8
p1 OK - 465.76 GB 976773168 6QG0TLHT
p2 OK u0 465.76 GB 976773168 6QG11Z7M
p3 OK u0 465.76 GB 976773168 6QG15ZP5
p4 OK u0 465.76 GB 976773168 6QG16SGK
p5 OK u0 465.76 GB 976773168 6QG15EYR
p6 OK u0 465.76 GB 976773168 6QG16SAM
p7 OK u1 465.76 GB 976773168 6QG14N85
p8 OK u0 465.76 GB 976773168 6QG12MYG
p9 OK u0 465.76 GB 976773168 6QG12NSB
p10 OK u0 465.76 GB 976773168 6QG15YP4
p11 OK u0 465.76 GB 976773168 6QG14N7G
p12 OK u0 465.76 GB 976773168 6QG10SS5
p13 OK u0 465.76 GB 976773168 6QG14N66
p14 OK u0 465.76 GB 976773168 6QG14N34
p15 OK u0 465.76 GB 976773168 6QG10PGX
//banana3000>
|
とHDD #1のステータス表示が「OK」と変更になった後、
30秒くらいしてからリビルドが開始された。
//banana3000> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
---------------------------------------------------------------
u0 RAID-6 REBUILDING 1%(A) - 64K 6053.47 ON OFF
u1 RAID-6 INOPERABLE - - 64K 6053.47 OFF OFF
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 465.76 GB 976773168 6QG15YS8
p1 REBUILDING u0 465.76 GB 976773168 6QG0TLHT
p2 OK u0 465.76 GB 976773168 6QG11Z7M
p3 OK u0 465.76 GB 976773168 6QG15ZP5
p4 OK u0 465.76 GB 976773168 6QG16SGK
p5 OK u0 465.76 GB 976773168 6QG15EYR
p6 OK u0 465.76 GB 976773168 6QG16SAM
p7 OK u1 465.76 GB 976773168 6QG14N85
p8 OK u0 465.76 GB 976773168 6QG12MYG
p9 OK u0 465.76 GB 976773168 6QG12NSB
p10 OK u0 465.76 GB 976773168 6QG15YP4
p11 OK u0 465.76 GB 976773168 6QG14N7G
p12 OK u0 465.76 GB 976773168 6QG10SS5
p13 OK u0 465.76 GB 976773168 6QG14N66
p14 OK u0 465.76 GB 976773168 6QG14N34
p15 OK u0 465.76 GB 976773168 6QG10PGX
//banana3000>
|
やったー!これで15本目がRAID本体に組み込まれた。
ただ、リビルドが終るまで4時間かかるけど・・・
リビルドが終ってから、最後にHDD #7(ホットスペア用)のHDDを新品のHDDに
入替えする様に手配しなきゃ。そう思って準備を始めようとした所、ICQから
メッセージが・・・
( ^ω^):「やあ!HDD #1はどうかな?」
('A`):「RAIDの本体に組み込まれて、今リビルドしているよ。終るのがあと4時間
くらいかなあ。」
( ^ω^):「やっぱり新品取り付けて正解だったな。」
('A`):「そうみたいだ。やって見ないと判らないなあ。」
( ^ω^):「じゃあホットスワップもすぐ直せるよ。さっき新品に差し替えたから。」
('A`):「え、え、えーーーーー」
( ^ω^):「え、さっき#7にも新品入れる必要がある、って言ってたじゃない。」
('A`):「そうだけど、リビルド終ってからお願いしようかな、と・・・」
( ^ω^):「HDD #7にはちゃんと新品入れたから、よろしく。じゃあね!」
('A`):「うあ、お、おい・・・」
急いで「ささやきスレ」とメールをチェックすると、確かにHDD #7に対して
HDDの入替えが発生していた。( ^ω^)、対応早すぎるよ・・・
まあ、でもこれで稼動中にホットスペアが作成できるか確認できるなあ、と
思えばむしろ良かったかも。
そんな訳でホットスペア作成の為、以下の手順を実行する。

1)上の画面でUnit 1 と書かれた横のチェックボックスにマウスでチェックをつけてから
「Delete Unit」のボタンをクリックする。
2)画面の左上にある「Rescan Controller」のボタンをクリックする。
3)すると画面の一番下の「Available Drives」の欄にHDD #7(画面上ではPort 7)が表示される。
そこで左横にあるチェックボックスをチェックしてから、下の「Create Unit」ボタンを
クリックする。
4)別の小画面(ダイアログ)が表示されるので、TYPE欄で「SPARE」を選択してから
「OK」ボタンを押す。
すると、、、できたー!HDD #7(p7)がホットスペアとして認識された。
(下のモニタ結果でUnitTypeがSPAREとなっているのがホットスペアです。)
//banana3000> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
---------------------------------------------------------------
u0 RAID-6 REBUILDING 12%(A) - 64K 6053.47 ON OFF
u1 SPARE OK - - - 465.753 - ON
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 465.76 GB 976773168 6QG15YS8
p1 REBUILDING u0 465.76 GB 976773168 6QG0TLHT
p2 OK u0 465.76 GB 976773168 6QG11Z7M
p3 OK u0 465.76 GB 976773168 6QG15ZP5
p4 OK u0 465.76 GB 976773168 6QG16SGK
p5 OK u0 465.76 GB 976773168 6QG15EYR
p6 OK u0 465.76 GB 976773168 6QG16SAM
p7 OK u1 465.76 GB 976773168 6QG15DFL
p8 OK u0 465.76 GB 976773168 6QG12MYG
p9 OK u0 465.76 GB 976773168 6QG12NSB
p10 OK u0 465.76 GB 976773168 6QG15YP4
p11 OK u0 465.76 GB 976773168 6QG14N7G
p12 OK u0 465.76 GB 976773168 6QG10SS5
p13 OK u0 465.76 GB 976773168 6QG14N66
p14 OK u0 465.76 GB 976773168 6QG14N34
p15 OK u0 465.76 GB 976773168 6QG10PGX
//banana3000>
|
(^_^;):「お、できたか。あとはリビルドが終れば完成か・・・」
そして最後の1本のリビルドが終わり、花子がスレにささやきました。
「これで元通りよ。ありがとう!」と言っているようで、ちょっとホッとした。
//banana3000> info c0
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
---------------------------------------------------------------
u0 RAID-6 OK - - 64K 6053.47 ON OFF
u1 SPARE OK - - - 465.753 - ON
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 465.76 GB 976773168 6QG15YS8
p1 OK u0 465.76 GB 976773168 6QG0TLHT
p2 OK u0 465.76 GB 976773168 6QG11Z7M
p3 OK u0 465.76 GB 976773168 6QG15ZP5
p4 OK u0 465.76 GB 976773168 6QG16SGK
p5 OK u0 465.76 GB 976773168 6QG15EYR
p6 OK u0 465.76 GB 976773168 6QG16SAM
p7 OK u1 465.76 GB 976773168 6QG15DFL
p8 OK u0 465.76 GB 976773168 6QG12MYG
p9 OK u0 465.76 GB 976773168 6QG12NSB
p10 OK u0 465.76 GB 976773168 6QG15YP4
p11 OK u0 465.76 GB 976773168 6QG14N7G
p12 OK u0 465.76 GB 976773168 6QG10SS5
p13 OK u0 465.76 GB 976773168 6QG14N66
p14 OK u0 465.76 GB 976773168 6QG14N34
p15 OK u0 465.76 GB 976773168 6QG10PGX
//banana3000>
|
翌日、稼動中のホットスペア切り替えと作成のテストをもう一度行なった後
「花子」はお客様の元へ向かいました。
(^_^;):「やっと完成したなあ。」
('A`):「そうですね。元気に動いてくれると良いです。」
(^_^;):「ん、まだまだホッとしちゃいかんぞ。次があるから・・・」
('A`):「えっ、えっ、次って何ですか?」
(^_^;):「「こぞうさん」、もう頼んでいるから年明けには来ると思うよw
という訳で、構築よろしく!」
('A`):「ま、まだ続くのね・・・orz」
実は「ぞうさん」の小型機として「こぞうさん」も年明けにやってきました。
(基本スペックは「ぞうさん」と同じですが、こちらは500GB x8本 搭載のサーバです。
サイズは2Uとよりコンパクトになってます。)
そして同じ様に「いななき 1.0」やRAID再構築テスト等を実施しています。
(「花代」という名前も頂いています。)
「ぞうさん」シリーズの開発はひと段落着きましたが、まだまだテーマは目白押しです。
次回からはまた外伝をお話しようと思っています。
テーマは・・・ちょっと迷っていますが、たぶん「ロードバランサー」になるかなあ。
それでは、また。
|
|
|
|
|
7日目に戻る。 9日目に続く。
解析
|