| ■ 【ぷろじぇくと ぞうさん】 〜E-Bananaサーバ 構築日記〜
|
第5日目:〜外伝U〜 コアルータアップグレード前夜祭(前編)
|
明けましておめでとうございます。('A`)です。
皆さんは年末年始休めましたか?良いお正月を迎えられましたか?
('A`)以下社員の面々は・・・・・年明けだと言うのに猛烈な追い込みの真っ最中だったりします。
本来ですと年末の「ささやき作戦」の続きを書く予定でしたが、昨年から計画していた
「別の作戦」が今週末にいよいよ本番を迎える為、急遽その作戦について2回に分けて
お話したいと思います。
その作戦とは・・・・「コアルータアップグレード」!
(弊社データセンター、PIEの基幹ネットワークの工事です、ハイ。。。)
今回は作戦が立案された経緯についてご説明します。
皆さんの中には既にPIEをご存知の方もいらっしゃると思いますが、改めてご説明致します。
PIE(Pacific Internet Exchange)社はアメリカはサンフランシスコにあるデータセンターです。
弊社のサーバ達はここに設置されていて、24時間・365日稼動しています。
(ココからDevid社長の雄姿と共にPIEの概要が日本語でご覧頂けます。)
PIEは2004年1月15日に世に現れてから実に多くのサーバを設置し運用を行なっています。
そしてPIEの特徴の1つとして最速・最高品質のネットワークで外部と接続されている事が
挙げられます。
そのネットワークを支えている機器がコアルータを始めとする以下のスイッチ群です。
(Extreme Networks社の機器を使用しています。)
・コアルータ Black Diamond x 2
こんな外観です
以前は4機体制で動いていましたが、今は2機体制になっています。
・通信用スイッチ Black Diamond x 2
Summit 200-48 x 9
Summit 200-24 x 1
Summit 400-48 x 4
こんな外観です(上が200-24、下が200-48)
|
※通信用スイッチについては他にも幾つかありますが、これらについてはちょっと判りません。
(PIEではハウジングサービスを提供しています。そして一部の顧客は独自のスイッチを
設置しているらしいのです。。。)
これらのスイッチ群はPIE誕生から丸3年以上膨大なトラフィックを日々処理してきました。
皆さんはあまり実感がないかもしれませんが、機械って人間の体以上に壊れ易いんですよ。
特にサーバとかは(使い方にもよりますが)HDDだけじゃなくて、電源ユニットやNIC、
マザーボードなど色々な箇所で故障が発生するんです。
(過電流が発生するとマザーボード上のコンデンサーが破裂して機能しなくなる、という
外見上からは判りづらい故障とか起きるんです。何度も泣かされました・・・)
そしてスイッチ群も然り、です。
今回のコアルータアップグレード作戦は昨年の夏(2007年7月)にDavid社長が来日した際に
始めて話題に上りました。
David社長は今後のインターネットの動向やデータセンターの在り様、機器等の現状を
スイッチ群のアップグレードを考えていました。
・動画配信等でネットワークやサーバは今以上にデータ転送能力が求められる。
(例えばギガビット転送ができるサーバやネットワーク)
・データセンターのネットワーク及びバックボーンはより高品質・高性能にする
必要がある。
・ネットワークで使用する機器は故障等が発生しない様に手当てする必要がある。
・一方、PIEのネットワーク機器は最近故障する頻度が上がってきているみたいだ。
・使用しているネットワーク機器が旧タイプ化してきた為、メーカからのサポートも
受けづらくなってきた。
・ネットワークに詳しい人材(専門家)をもっと増やす必要がある。
|
そこで当初(2007年の夏)は2007年末までにネットワーク機器を新しい機械にアップグレード
しよう、今からその準備を始めよう、という話になりました。
('A`)はこのアップグレードの準備の一環で2007年10月に「第一陣」としてPIEに出張しました。
が、、、、その時にスイッチの1つ(しかもDNSサーバが接続していたスイッチ)で故障が発生し、
現地で復旧に当たってました。
(4時間近く多くのサーバが外部と接続しづらい状況になったんです。)
スイッチの部品(サーバ達と接続する為のネットワークカード)が壊れてしまっていたのですが、
交換用部品(PIEでは緊急事態に備え各機器の部品をストックしています)を使って故障箇所と
交換・新しくしたネットワークカードへのサーバの繋ぎ変えを手分けして行ない、復旧しました。
スイッチは復旧したのですが、その直後('A`)の方がダウンし数日異国の地で寝たきりになる、
というオマケまでつきました・・・
(日本だけでなく海外でもぶっ倒れるひ弱な男として社内で一目置かれる様になりました。)
そんな事があって社内では2007年10月からDavid社長以下PIEのスタッフと共にこの
アップグレード作戦を水面下で準備を進めていました。
(社員が交代でPIEに出張し下準備を行ないました。その間日本の留守部隊はメンバー減で
大変でしたが・・・)
そしてPIEでもこのアップグレード作戦に伴い、新たなメンバーとしてRobertさんがデビュー
しました。
Robertさんは米国有数の回線事業者(Tier1と呼ばれる最上位のISP)の1つであるLevel3社で
ネットワークエンジニアとして現場で働いていた人です。
(※Level3社に関する小話はココを参照して下さい。)
ちょうど('A`)が出張に行った時期に入社され実際にお会いしたのですが、「いぶし銀」・「職人」
という感じでした。
ブランク無しでPIEに移られて来たので、バリバリの即戦力です。
(今回の作戦も詳細はこの人が計画・準備しています。)
そして今回導入する機器は「Force10 Networks」社のを採用しています。
(ココからForce10社のページがご覧頂けます。どんな製品なのか感じが掴めると思います。)
ちょっと前置きが長くなりましたが、次回はアップグレード作戦の詳細と今まで行なってきた
準備作業、作戦の直前状況等をお話したいと思います。
|
|
[Level3について]
Level3 Communications 社(http://www.level3.com/)は米国でも大手の回線事業者(Tier1
というカテゴリに分類されます)の1つです。
Tier1とは最上位のISPで、自社で世界的なネットワーク(回線)を持っている存在です。
有名な所では「AT&T」、「Cogent Communications」、「Qwest」、「AOL」等があります。
数年前NTTコミュニケーションズに買収された「Verio」もTier1です。
NTTコミュニケーションズはVerio社や他の会社を傘下に収めた事でアジア有数のバックボーンを
構築しています。
中小のプロバイダはこの様なTier1から回線のトランジット契約(乗り継ぎという意味です)を
結んで、外部との接続を行ないます。
これは皆さんがプロバイダと契約している様に接続料(使用料)を払って回線を使わせてもらう
という形態です。
一方大手の通信事業者同士はピア契約(対等という意味です)を結び外部と接続します。
これはお互いの通信量が同程度である事を前提にお互いの回線を繋ぎ相手の通信を「中継」
してあげる事で本来かかる接続料(使用料)を相殺し、結果的にネットワーク(接続先)を
広げていく形態です。
Level3が有名になったのは2年以上前(確か2005年10月頃)にCogent Communications社との
相互接続を一時的に遮断する、という「荒業」を繰り出した時です。
これは弊社も含め日本のユーザが米国のサイトへ極端に接続しづらくなるという問題を
発生させました。
(当時のニュースを見るとCogent社の規模が大きくなってLevel3側がこのままピア契約で
続けると「割りに合わない」から接続料を払え、というのに端を発した事になっています。)
こういう事が起きると当事者(Level3やCogent)よりも、これらと接続する中小のプロバイダや
その回線を利用している一般ユーザに大きな影響が出てしまいます。
(今まで通っていた道が突然「通せんぼ」をかけられてしまう訳ですから。)
弊社でもこの時多くのお客様から数日に渡り「自宅・会社からサーバへ接続しずらいよー」と
お困りになられた声を聞き、迂回路とか無いか対応を行なっていました。
今後のインターネット、特に回線事業者の動向がどうなるか('A`)の頭では検討もつきません。
が、特定の回線に依存しない様なネットワーク環境の確保が必要と考えます。
(PIEでは特にアジア方面へのネットワーク接続を睨んで、Cogent・NTTコミュニケーションズ・
日本テレコムと複数の回線との接続を行なっています。)
|
|
|
|
|
4日目に戻る。 6日目に続く。
解析
|