先日あったNTT東日本による事故の様子だと、BGPの特性によるものなのだろうか。
障害が起きたのは、15日午後6時44分ごろ。台東区蔵前にある同社ビル内に設置したルータ1台でハード故障が発生したため、予備系に切り替えて故障部分のパッケージを交換し、その後元のルータに再接続したが、これが引き金になった。
再接続すると、同社管内の約4000台のルータでルート情報の自動書き換えが行われるが、その際、一部で処理能力を超えるルート情報が発生。連鎖的に約2000台のルータで処理能力をオーバーして「ルートフラッピング」と呼ばれる状態になり、パケット転送処理が停止した。
つまり、4000台のルータのうち1台が故障し、BGPでルーティング情報を下位のルータへ伝達する際、そのルーティング情報を伝送した結果こうなったとあるけれど、予備系に切り替えた機器のルーティング情報はいかに。。。
憶測ですが、BGPで「こっちの経路使って」と送ったとたんに「やっぱこっちの経路にもどして」といった情報がいっぺんに錯綜しちゃって、結果ルーティングテーブルの肥大・破壊が発生し一切パケット転送が出来なくなったとかかなぁ。
ってかNTT東日本さん。BGPを利用しない、スタティックなルーティング経路を用意した方がいいんではないんすかね。。。どうせフルメッシュなネットワーク構成を地域IP網で構成したとしても、結果プロバイダの接続先ってユーザから見たら東京にある大手町からの接続になるんでしょうから。。
こんなんじゃ本来のインターネットではなく、東京を中心としたスター型ネットワークだと個人的には思う。
今度我が家でRIPの実験でもしてみるかなぁ。

コメントする