第77日目:【A-Tiger】('A`)/A-Tigerサーバ、もうすぐ発売です〜
|
どうも、('A`)です。
御無沙汰しております。長く日記を更新していませんでした。
ちょっと短いですが、近況報告も兼ねて、現状をお話します。
「IPv6はどうなったの?」とか聞かれますが、、、root弟(´・ω・`)がRobertに何度か
話し合いをした結果、どうもスイッチとかの設定も含めてもう一度見直してみよう、と
いう事になりまして・・・関係各方面で動いています。
ってか、今は猛烈にバタバタしています。
ご存じかもしれませんが、いよいよA-Tigerサーバの発売が近づきまして、社内総出で
準備に追われています。
('A`)もあぶらみくん( `э´)と一緒にA-Tigerをせっせと作っているのですが、今日は
出荷したサーバ(Tiger3515)の/etc/rc.confに誤りがあって・・・凹んでます。
ifconfig_em0="inet 207.29.247.2 media 100BaseTX mediaopt full-duplex netmask 255.255.255.0"
(ちなみに tiger3515 のIPアドレスは 207.29.247.145 です。)
出す前に気づかないといけないのになあ・・・はぁ
この件が判ったきっかけがありまして、、、突然tiger3515に繋がらなくなったという
報告が上がりました。
で、その時に確認された現象と対処内容はサーバリフレッシュスレでむむむさんが
詳細に報告されているのですが、要は
・突然tiger3515に関するarpテーブル情報が誤った内容に変わってしまって
通信できなくなる。
・なのでOS起動時にarpテーブルを強制的にクリアして、内容を正しくする様に
仕掛けをした
、という事です。
で、その調査の過程で上記の誤りが見つかった訳です・・・
('A`)も( `э´)も顔を見合せて、「触ってないよー!ってか、その設定でなんで
繋がるの???」と狐につままれた感じです、ハイ。
でも、事実は事実ですから、、、
これでもか、という位に確認しておかなければならない処ですから。
次からはそんな事が起きない様に仕組みを入れますので、ご勘弁を・・・
で、('A`)が1点気になっている事があります。これはPIEの技術者に協力してもらって
調べようと考えています。
それは「なんでOS起動前にarp情報(というかNICのMACアドレス)が本来のNICに
付与されている値の"1番違い"で認識されているのか」という事です。
通常NICのMACアドレスはBIOSの設定とかでいじらない限り工場出荷時のままの値が
記録されています。
あ、MACアドレスを書き換える方法は他にもあります。
例えば /etc/rc.localで ifconfig em0 link 00:1c:c0:6c:ef:09 と設定してあげると、
起動時に書き変わりますが、T-BananaサーバやA-T-gerサーバではMACアドレスは
いじっていません。
(というか、昔('A`)が試しにMACアドレスを変更する仕掛けをしてサーバをリブートしたら、
Intelのマザーボードが「優秀」なのか判りませんが、二度と外部と繋がらなくなる、という
現象が発生して、大変な目にあいました・・・)
ところが、今回むむむさんの報告で判る事は
・tiger3515の本来のNICのMACアドレスは00:1c:c0:6c:ef:08である
・通信できない間、NICのMACアドレスは00:1c:c0:6c:ef:09で他のサーバ達に認識されている
という2点です。
('A`)も技術に携わる人間の1人として、憶測(というか妄想)で話をするのはなるべく
避ける様にしていますが、この現象を聞いて思い当たる事があります。
それはIntelのマザーボードに搭載されている「Active Management Technology(AMT)」
という機能です。
これは例えばあるマシンがダウンした時に別のマシンからネットワーク経由で該当マシンに
アクセスし、各種情報の取得や電源のON/OFFまでやってしまうという仕組みらしいです。
(すみません。('A`)は実際に使った事がないので、色んなニュースや解説ページで見た
内容を書いてます・・・)
もし「本来のNICのMACアドレス」とは別のMACアドレスを持っているなら、電源が完全断
している時以外は、その別MACアドレスでアクセスできるのだろうか・・・
arpテーブルの情報が変わるというのを最初に聞いて、「もしかして、スイッチ側で悪さを
しているのかなあ?」とか思ったのですが、OS起動時に本来のMACアドレスに変わるという
事象が観察されたので、もしかすると、AMTがオンになっているのかな、という事も可能性
として考えられてきました。
あ、あくまで可能性ですよ。まだ確認していませんから・・・
(そういう意味で('A`)の個人的な憶測に過ぎないのです。なので、本当はこういう事は
滅多に書くものじゃありません。でもなあ、、、それくらいしか思いつかないんですよ。)
いずれにしても、今後調査してみます。
あ、あと今朝「花子」(banana3000)がダウン状態になって、昼過ぎに復旧しました。
何故かリモートコンソール(SSHとは違います)からサーバにログインするところまでは
出来たのですが、サーバ内からrebootコマンドで再起動しようとしたら、終了しない
「幾つかのプロセスを停止できません、うんぬん。」というメッセージが出て、
そこでキーを受け付けなくなりまして・・・
なので、いったん電源スイッチをOFFにして、
シングルユーザモードで起動 -> fsck実行 -> デフォルトモードで再起動
、という手順で復旧させました。
で、花子スレで「マザーボードやCPUの温度をなんで計測しないの?」とご質問を
頂きましたが・・・未だに計測できていません。
('A`)もmbmonとか色々なツールを入れて試したのですが、正しい値が得られないです。
で、「Intelは温度とかの情報を取る方法(仕様)を外部に公開していない」という事を
小耳にはさんだのですが、本当にそうなのかなあ・・・
Windowsで動くソフトだとそれっぽいデータが表示できる様なのですが、扱っているOSは
FreeBSDですから、使えないです。
('A`)も何度かツール探しの旅に出ていますが、もし何か有効なツールをご存じでしたら
教えて頂けるととても助かります・・・
本業の方に戻ります。
それでは、また。
|
|
|
|
|