第58日目:久しぶりのロードバランサーなのですが・・・
|
どうも、('A`)です。
えーと、昨夜は数台のサーバが突然ネットワークに繋がらなくなる、という
アクシデントが発生して、疲れた体に鞭打って復旧作業を進めていました。
今はもう問題も解決されて、全台順調に稼働しています。
幸いにもまだお客様にお渡ししていないサーバがほとんどだったので、一時的に
怪しいと思われるサーバの電源を完全にOFFにして、Brian( ^ω^)にネットワークの
設定周りを調べてもらいました。
(まあ、実際にはRobertが調べていたのですが・・・)
で、どうもネットワークの設定を調べてみると、電源を落としたサーバ達のVLAN
設定の1つに Spanning Tree Protocolというのがあるのですが、その設定が
おかしい内容だったので、VLANで設定されていたIP大台(207.29.247.xxx)を持つ
幾つかのサーバで通信が不定期に遮断される、という現象を引き起こしていました。
Spanning Tree Protocolの設定で実際には使用されていない(本来だと登録から
除かなければならない)ポートが4つあって、そのうちの1つに今回電源を落として
「隔離状態」にしたサーバが繋がっていました。
('A`)はあまり詳しくないのですが、Spanning Tree Protocolは「スイッチ間で
通信されるデータ(フレーム)がネットワーク内で無限ループしないように、
特定のポートで流れてくるデータ(フレーム)をブロックする」仕組みです。
これを応用すると、ある特定のスイッチで障害が発生し通信できなくなっても
今までブロックしていたポートを開放する事で、他のスイッチとの間の通信を
行えるようにする(つまり迂回路を用意する)事が可能となります。
で、今回はその設定がちょっとまずい内容だったと。
(そうだよね。実際サーバが繋がっているポートをそういう特殊な設定にしていたら
通信できなくなっちゃいますよ。)
それでBrian( ^ω^)以下PIEの技術陣が設定を直して、ようやく電源を止めていた
サーバ達が復活しました。
今は順調に動いていますが、念の為2日間は観察(監視)を続けます。
という事で、ようやくひと段落つきました。
ここ1か月の疲れがどっと出た様な状況ですが、A-Tigerも順調に稼働していますし
(除く1号機)、怒涛のサーバインストールも今日は無かったので、久しぶりに
ロードバランサーを触り始めています。
(というか、そろそろ終わらせないとならないな、と。)
で、先月テストの為に一時的電源を止めていたサーバを再起動してみたのですが、
繋がらないです(泣
あれこれ調べているのですが、どうもネットワークケーブルが外れているようです。
なので、PIEの技術スタッフにケーブルの調査と手動でのサーバ再起動をお願いして
いるところです。
(どうもケーブルは繋がっているけど、こちらからはpingが通じません。もしかして
ケーブルが断線しているか、オンボードのNICがおかしくなったか・・・)
それも含めていま調べています。。。
でもね、、、彼らそれどころじゃなかったんです。
返事が遅いので「何してるんだい?」って聞いたら、「('A`)、DualにOS入れたよ!
サーバ内からもリブートできる様になったんだ!」って返事が。。。
それはそれで嬉しいけど、今日の('A`)はロードバランサーを触りたいのですっ!!!
頼むからリブートして。。。
といった訳で、現在待ち状態です。あーあ
さて、昨日ご紹介した「Dualサーバ(banana3601というサーバ名がついています)」に
ついて続報を書きます。
まず、「rebootコマンドで再起動しない」という問題ですが、これは解決しました。
Polywellの技術者からBrian( ^ω^)にそのオプションの設定方法が伝授されました。
(口伝だけだと「忘れちゃった」とBrian( ^ω^)が後から言いだしかねないので、
Polywelから文章で設定方法を教えてもらう様にお願いするんだよ、と伝えました。)
次にCPUですが、、、どうも今回のマザーボードではCore2Duoのモバイル版の最新
(T5250)はサポートしていないので、T2300を取り付けた、との連絡を貰いました。
ちょっと残念ですが、クロック数を見るとT2300は1.66GHz, T5250は2.00GHzなので
T2300でも試してみる価値はありそうです。
なので、今回はこのCPUで動かしてみます。
最後に冷却用ファンについてpolywellに聞いたのですが、基本的に発熱を抑えた
構成にしたし、Polywellの出荷前テスト(約24〜48時間動かしっぱにします。)で
オーバーヒートによるダウンは発生しなかったと。
心配だったらサーバラックの一番上に設置して使ってみて、とも言われました。
サーバとサーバの間に設置すると、上下のサーバからの熱が伝導する可能性が
あるので、一番上なら下だけを注意すれば良いはずと。
(でもね、例えば冬の季節に部屋で暖房を使うと判ると思うのですが、「熱」って
普通上の方にあがっていくと思うのですが・・・違うのかなあ?)
Polywellもテストで確認した後で持ってきてくれたのですから、この状態で
動かしてみよう。
ネットワークの設定がまだなので、今回はBrian( ^ω^)直々に設定してもらう
事にしました。(昨夜の件もあるので、ここは確実な段取りで進めます。)
もう少しお待ちを。
という事で、なかなか物事の進展が遅いのですが、ちょっとづつ進めています。
あ、明日までに体力回復しないと(でも、今夜は夜間監視・・・)
お腹が珍しく痛いのですが、それだけでも回復しておこう。
今日は何だか尻切れトンボの内容となっちゃいましたが、この辺で。
|
|
|
|
|