!Linux Maze   ADSL挌闘記


2001/Mar よりADSL開始 フレッツ+DynamicDNSで接続がTAからDSLモデムに変わっただけ
グローバル1個に対してマスカレードとIPフォワードで問題なく動作を確認
そこで、メインの接続もADSLにしようとしたことが地獄の始まりだった。
2001/Jul フレッツ+Biz8(InfoSphere)を選択
約2週間かけてIPをレジストしなおす。
最初の接続環境は
SERVER[グローバル]--BA512--MODEM
という状態、たまに切断されるが、さほど遅くは無い。
BA512は自動切断しない設定にしてしまうと、逆に内部から再接続はできなくなってしまうとの
ことなので無通信タイムアウトは設定したままだったのだ。

スクリプトを色々工夫してみる。
1.60分の無通信でタイムアウトするので、60minごとに外部へむけてping する。
 これでたぶん切れないはず。

2.やはり切れるので、
 30min毎にする。
 が、しかし切れる。 > どうやら無通信による自動切断ではないらしい。

3.異常切断された場合でも、30min〜1hの間通信ができなければ、自動切断が効いて
 その30min後には回線が復帰するはず… しかしルータ自体がハング!!

4.切断される回数は1日に1回乃至2回程度、回線の問題かルータの問題かわからないまま
 常時接続モード(セッションキープアライブ)を持つBA512Rへ

5.状態はさらに悪化、挙句の果てBA512RはCMOS飛ばしまで出る…

ルータをLINUXマシンで

1.BAシリーズではLOG機能がほとんど無く、原因はさっぱりわからない。
 そこでLinuxマシンをルータとして設定
 pppoeドライバ(rp-pppoe)にはどうもグローバルルータとしての設定が入っていないのか苦戦。
 接続スクリプトをある程度自分でいじる。

2.ログを見るために、pppoe側の自動なんたらは使わず。
 cronで1分毎に状態を取得、切れていたら再接続をするようにスクリプトを組む
一体何が原因?
1.何が起こっていたかというと、数時間から20時間に1回"異常切断"が起きる。
 一度異常切断が起きるとその後30分から2時間にわたって再接続はするものの
 ろくに通信ができないまま、1分程度で異常切断するという状態が続く。
 再接続時の認証が通らない場合はISP側でセッションの切断が確認できないということであり
 認証が通る場合は、ISP側でもセッションの切断が確認されているということがわかった。
 BA512Rのセッションキープアライブでこれをやってしまうと再接続回数は1時間あたり数十回
 しかも、認証に失敗しようものなら、回数測定不能な再接続を繰り返した挙句接続できない
 というケースが発生する。これはハングするわけだ。

 これは回線の問題としか思えなかった。

 そこで、NTT側に収容ポートの変更及びビル内のMDFからフロアまでの経路を変更してもらう。
そんなのあり?

1.結果として回線の問題ではなさそうだ、問題はあいかわらず起きている。
2.ISPはスタンドアロンでの接続テストを強調するが、固定IP8個のサービスで
 スタンドアロンテストしてもしょーがないのでは?
 と思いつつも、障害が起きているときにLOCAL側(といってもグローバルIPだが…)のNICをDOWN
 してみると… なんと
 通信できる…
 といってもそれじゃー使い物にはなりませんが (^^;
 ルーティングテーブル自体は間違ってはいない、しかし異常切断 > 再接続という手順の場合には
 標準的なルーティングテーブルではダメなようだ。

 その後色々な考え方を試すが、根本的な解決はできず…
 
推測1.何か特殊なルーティングテーブルで対応ができる。
推測2.pppoeが根本的に固定IP複数個を想定していないために起こった穴である。

 
そうは言っても…
 もう一度ISPに相談する。そもそもDSLで固定IP複数個は無理なのではないの?と。
 すると、10分間の無接続を設けろという。
 NTTのフレッツの仕様上、異常切断したあと10分間は再接続できないという。
 この話自体は有名な話ではあるが、なんとここで言う”再接続ができない”というのは
 あくまでも通信が出来ないという意味で認証ができないという意味ではないと言う。
 (サポートもそのへんの区別はついていないのだそうだ。)
 なんだぁそりゃぁ!ゴルァ!もっと早く言え!ってゆーか正確に書けぇ!
 というわけで再接続のスクリプトに異常切断を発見した場合、切断を実行し10分後に再接続するように
 書き直す。
 とりあえず。その後20h程は切れていない。明日が楽しみじゃわい。

 結果として… なぜか切れなくなった???
 たまに異常切断が起こるものの復帰時間はおよそ30min 程度
 現象自体は完全に解決されたわけではなく、切断の頻度が減ったことと
 復帰までの時間が大きく減っただけである。
 まぁこれくらいだったら実務に影響があまり出ないのですが、根本的な解決とは思えないなぁ。
 
速度に関して
 現在2本のADSL回線を同じ収容局内で持っているが、開通当初はどちらも900kbps〜1.1Mbpsほどの
 レートを出していた。
 当時NTTの収容局側の営業からは収容局側のルータに700kbpsの帯域制限が存在するような話をしていて
 よかったですね。と言われていたが、現在では400kbps〜550kbps程度。
 それでも128kbpsのOCNエコノミーよりは格段に速いのではありますが…