社内ネットワークのトラブルで、今でもはっきり覚えている出来事があります。
自分でルータの設定をミスって、自分自身が社内ネットワークから締め出された話です。
ネットワーク系のトラブルって、サーバよりも「一瞬で全部止まる」ことがあるので、正直かなり怖い分野だと思っています。その中でも、ルータ設定は毎回ちょっと緊張します。
きっかけ
ある日、社内ネットワークの経路制御を見直す作業がありました。
拠点間VPNや一部の通信経路を整理していて、「送信元を指定して特定経路に流す」設定を入れようとしたのがきっかけです。
ルーティング自体はネットワークの基本中の基本なんですが、実務でしっかり理解している人って、意外と少ない印象があります。
私自身も、理屈では分かっていても、実際の設定では毎回慎重になります。
状況
今回やろうとしたのは、通常のデフォルトルートとは別に、
- 特定の送信元IPアドレス
- 特定の宛先ネットワーク
に対して、別経路を通す設定。
よくある構成ですし、手順も頭には入っていました。
で、設定を投入。
数秒後。
「あれ?」
社内の管理用端末から、ルータに繋がらない。
Webも見えない。
SSHも通らない。
…完全にネットワークから締め出されました。
原因① ルーティング設定ミス
原因は単純で、送信元アドレスの指定範囲を盛大に間違えていたこと。
本来は「管理用端末1台分」だけを指定するつもりが、誤って社内セグメント全体を対象にしてしまい、社内からの通信が一斉におかしな経路へ流れていました。
結果として、
- ルータへの管理通信
- 社内からのインターネット通信
- VPN管理系通信
すべてがおかしなルートへ。
気づくまで、だいたい1分くらい。
体感では10分くらいに感じました(笑)
幸い、すぐ隣にルータ本体があり、コンソール接続で設定を戻して復旧。
遠隔地じゃなくて本当に良かったです。
原因② 設定一括投入ミス
別の日には、もっとヒヤッとすることがありました。
複数拠点のルータ設定を整理していて、
「設定を一括で投入 → 動作確認」という流れで作業していた時。
……全く別のルータ用設定を突っ込んでしまった。
その瞬間、社内ネットワークが無音に。
「やばい」
幸いこの時も現地にいたので、すぐに初期設定へ戻して復旧できましたが、
もしこれが遠隔地拠点だったら詰んでました。
ルータ設定って、
- 失敗 = 即通信断
- リモート作業 = 自殺行為
になりかねないんですよね。
詰まった点・反省点
この手のトラブル、原因はほぼ毎回同じです。
- 思い込み
- 設定範囲の確認不足
- 検証不足
- 作業前のバックアップ未取得
特にルーティングは、
「1行の設定で全通信を殺せる」 破壊力があります。
頭では分かっていても、
- いつもやっている作業
- 慣れている機種
- 単純そうな変更
こういう時ほど、油断が出ます。
最終対応
この一件以降、ルータ作業の前には必ず以下を徹底するようになりました。
- 現在設定のフルバックアップ取得
- 投入予定設定の差分確認
- 対象IP範囲の再確認
- 可能な限り現地作業 or 物理接続確保
正直、これだけやっても怖いですが、
やらないより100倍マシです。
今の正直な感想
サーバ障害も怖いですが、
ネットワーク障害は比じゃないレベルで影響範囲が広いと実感しています。
最近は、社内サーバをVPSやクラウドへ移行することも増えて、
オンプレ環境のトラブルはだいぶ減りました。
それでも、
社内ネットワークとルータだけは、最後まで残る鬼門だと思っています。
「設定を入れる前に、一呼吸おく」
これ、地味ですが本当に大事です。


