検索

- 葡萄酒|威士忌|白兰地|啤酒-。

ネットワークのパケットロスネットワーク・エンジニアには1つの記事で十分だ

ブログ 2870

00c0909eeae57f737f79953544f19260

1.ネットワーク・パケットロスとは?

ネットワーク・パケット・ロスとは、その名が示すように、データ伝送中に一部のデータ・パケットが送信元アドレスから宛先アドレスへの伝送に失敗し、途中で「紛失」または「破棄」される状況を指す。
パケットロスは「ネットワークの切断」とは異なるが、ネットワーク品質に直接影響する:

 

  • ウェブページの読み込みが極端に遅い
  • ビデオ会議における遅延と高遅延
  • ファイル転送の中断やダウンロードの失敗
  • 高いゲーム遅延とキャラクターのテレポート

2.パケットロスはどこで発生するのか?

データパケットは、送信元から宛先まで、数多くのデバイスや経路を経由して移動する。パケットロスは、チェーンのどのリンクにも問題がある場合に発生する可能性がある:

場所別の一般的な原因:

  • ローカルデバイス(PC、ネットワークカードなど):ドライバの異常、ネットワークカードの老朽化、リソースの枯渇。
  • アクセス層(スイッチ):ポートの輻輳、ブロードキャストストーム、ループ。
  • ディストリビューション/コアレイヤーデバイスのCPU使用率が高い、インターフェースの送受信に異常がある。
  • ファイアウォールACLやポリシーの誤認識、リソースのボトルネック。
  • 出口リンク:ISP側の品質が悪く、パケットロスが激しい。
  • クラウドサービス:クラウド側でのパケットロス(ユーザー制御不能)。

3.真のパケットロス」と「偽のパケットロス」の見分け方は?

多くの初心者は、失敗したpingや遅い応答を見ると、すぐにパケットロスを想定する。しかし、「偽のパケットロス」には注意が必要です:

 

  • ファイアウォールやACLがICMPをブロックしても、サービスパケットが本当に失われるわけではない。
  • 中間ホップでのパケットロスがあっても、宛先へのアクセスが正常であれば、本当のロスを意味しない。
  • 短時間のネットワーク・ジッター(リンクの収束など)は、安定性の問題ではなく、過渡的な損失を引き起こす可能性がある。

 

キーポイント真のパケットロスは、通常、以下の基準を満たす:

 

  • 持続的(散発的ではない)
  • 複数のツール(ping、iperf、パケットキャプチャ)で一貫性がある。
  • 安定した再現性のある損失位置

4.一般的な検出ツールとは?

  1. ピング
    最も基本的なパケットロス検査ツール。ICMPパケットを送信し、ラウンドトリップの正常性をチェックする。
    バッシュ
    ping 192.168.1.1 -t # 連続ping
    ping -n 50 8.8.8.8 # 50回のping試行  
    
    注:一部のデバイスでICMPがブロックされても、ネットワークが切断されるわけではありません。
  2. トレースルート
    どのホップからデータがドロップし始めるかを決定する。
    バッシュ
    tracert www.baidu.com # Windows
    traceroute www.baidu.com # Linux  
    
  3. iperf
    UDPパケットロスの検出をサポートし、より高い精度を実現するプロ仕様のパフォーマンス・テスト・ツール。
    バッシュ
    iperf3 -c 192.168.1.100 -u -b 10M -t 10 # 10Mbpsで10秒間のUDPテスト  
    
  4. パケットキャプチャ(Wireshark/tcpdump)
    データが送信され、承認されたかどうかをチェックする中核的な検証方法。

5.ネットワーク・パケットロスの原因は?

パケットロスは、ネットワーク機器の問題とリンク品質の問題という2つの主なカテゴリーに起因します。詳しく説明しよう:

1.帯域幅の飽和(輻輳による損失)

  • 原理:インターフェイスは過剰なデータを処理できないため、バッファがいっぱいになるとパケットを強制的にドロップする。
  • よくあるシナリオ:
    • ポートの帯域幅を超える大量のトラフィック(バックアップ、ビデオ転送など)。
    • コアスイッチのアップリンクポートを飽和させるクロスVLANアクセス。
  • 判定方法:
    • インターフェイスの帯域幅使用率をチェックする(表示インターフェイスなど)。
    • ポート・トラフィックをモニターする(例:カウンター・インターフェイスの表示)。

2.インターフェースのエラーと物理的問題

  • 症状パッチケーブルの緩み、光モジュールの接触不良、ツイストペア配線の誤りにより、断続的な損失が発生することがあります。
  • 主な指標
    • CRCエラー(巡回冗長検査)
    • 入出力ドロップ
  • トラブルシューティングの提案
    • display interface briefでエラーパケットの統計情報を確認する。
    • パッチケーブルを差し直すか、新しいツイストペアワイヤーでテストする。

3.高いCPU/メモリ使用率

  • デバイスの処理能力不足はロスにつながる。
  • で共通:
    • マルチデバイスのスタッキングにおける高いマスターコントロール圧。
    • ポリシー、NAT、セッションの同時実行でファイアウォールがクラッシュする。
    • 転送能力に影響するCPUが飙升のルーター。
  • トラブルシューティングの方法
    • デバイスのCPU使用率をチェックする(cpu-usageを表示)。
    • 過剰な転送エントリ(ARPテーブル、MACテーブルなど)を検証する。

4.ブロードキャスト・ストーム/ループ問題

  • 典型的な症状管理ポートのping失敗を含む、広範囲にわたるネットワーク停止。
  • 調査の方向性
    • STPが有効になっているか、ループ保護が有効になっているかを確認する。
    • 過剰に繰り返されるブロードキャスト(ストーム)のパケットをキャプチャする。

5.ポリシーの誤認 (ACL、ファイアウォール)

  • 損失」と認識されることもあるが、実際にはトラフィックはポリシーによって拒否される。
  • チェックポイント
    • ACLルールがトラフィックを許可するかどうかを確認する。
    • ファイアウォールの廃棄ポリシーを確認する。
  • 事例あるクライアントが、スイッチACLがTCPポート443(HTTPS)をブロックしているために、サーバーがタイムアウトした。

6.科学的トラブルシューティングのロジックフローチャート

[Terminal Loss?]
↳ ローカルNICドライバ、使用率、ARPをチェックする
[アクセス層の損失?]
↳ ポートトラフィック、CRC、MAC学習をチェックする
[ディストリビューション/コア層の損失?]
↳ リンク負荷、ポリシー設定、NAT転送をチェックする
[出口損失?]
↳ ISP回線品質、SLA、外部速度テスト
[アプリケーション層の誤判定?]
アプリケーションのバグ、セッション制御、短いタイムアウト  

7.高頻度パケットロス・シナリオとケース・サマリー

ケース1:リンク不安定時の断続的なロス

  • 症状50%のping成功率、ウェブの読み込みが遅い。
  • 原因がある:
    • ネットワークケーブルの緩み
    • インターフェイス・ネゴシエーションの異常(ギガビット対100Mbps)
    • 応答を制限するファイアウォールICMPフラッドプロテクション
  • 解決策
    • ケーブルを交換し、一貫したネゴシエーションを行う。
    • ファイアウォール・ポリシーを調整し、ICMP検出頻度を緩和する。

ケース2:電源投入後のスイッチ通信障害

  • 症状本装置が起動後数分間、どのホストにも ping を送信できない。
  • 原因がある:
    • 起動時の設定ロード時間
    • STP(スパニングツリー)が収束していない、ポートがブロッキング状態
  • 解決策
    • スパニングツリー・ポートファスト(Cisco)またはstp edged-port enable(Huawei)を使用して、ポートのアクティブ化を加速する。
    • STPが完全に収束した後のテスト。

ケース3:5ポートスイッチは4ポートしかサポートしない

  • 症状5番目のポートが接続されているときに、1つのポートが故障する。
  • 原因がある:
    • 不十分な電源供給
    • チップの老朽化またはハードウェアの故障
  • 解決策
    • スイッチを交換する。
    • プロ仕様のツールでチップ電源と電流変動をテスト。

ケース 4: スイッチ "COL"点灯・点滅、通信なし

  • 症状ポート通信の異常、パケットキャプチャの激しいロス。
  • 原因がある:
    • 衝突!(衝突ライトで表示)
    • ポートが全二重でない機器に接続されている、ネゴシエーションに失敗している
  • 解決策
    • 一貫したデュプレックスモードを手動で指定する。
    • 非互換性を避けるため、ケーブルや古いデバイスを交換する。

ケース5:ギガビットへのアップグレード後の頻繁なサービス切断

  • 症状ギガビットリンクでの断続的なサーバー接続、キャプチャでの頻繁な再送信。
  • 原因がある:
    • ギガビット・リンク用のケーブル/モジュールの品質が不十分
    • 不安定なネゴシエーションの原因となるポート速度のロック解除
  • 解決策
    • Cat6+ケーブルを使用してください。
    • 手動でギガビット全二重にロック。
    • NICドライバーとスイッチのファームウェアを更新する。

ケース 6:深刻なクロス VLAN 通信損失

  • 症状VLAN内では正常だが、VLANをまたぐとPingが途切れる。
  • 原因がある:
    • 誤ったレイヤー3 VLANインターフェースの設定
    • トラフィックを制限するACL
    • ARPテーブルのエントリが古い
  • 解決策
    • VLANインターフェイスのIP、サブネット、ルートを確認します。
    • 再学習のためにARPキャッシュをクリアする。
    • ICMPフィルタリングをチェックするためにパケットをキャプチャする。

8.芽の段階でパケットロスを防ぐには?

  1. 信頼性の高いデバイス選択:
    • ハイコンカレンシー環境では、ローエンドのスイッチは避ける。
    • 重要なノードには、QoSおよびハードウェア転送に対応したデバイスを使用する。
  2. 定期検査の仕組み:
    • CPU、メモリ、インタフェースのトラフィック、エラーパケットを定期的にチェックする。
    • SNMP+ネットワーク管理プラットフォームを導入し、7×24のアラートを出す。
  3. 立地環境への配慮:
    • 机房(サーバールーム)の温度を20~25℃に保つ。
    • クリーンな電源、確実な接地、静電気防止を確保する。
  4. 標準化された構成と文書化:
    • すべての変更とロールバック計画を記録する。
    • 人為的ミスを避けるために、構成テンプレートを使用する。
  5. トライアド+パケットキャプチャのトラブルシューティング:
    • ARP、ICMP、TCPハンドシェイクのキャプチャを優先する。
    • ping+traceroute+iperfを併用する。
    • DNS、VLAN、ACL、およびルートにエラーがないことを確認します。

 

パケットロスを恐れるな。トラブルシューティングの方法がわからないことを恐れるな!
ネットワーク・パケットロスは複雑なものではありませんが、ネットワーク・アーキテクチャ全般の理解、デバイスのメカニズムへの精通、ツールの使い方の熟練度が試されます。より体系的で専門的であればあるほど、より効果的に取り組むことができます。
前の記事 次だ:

関連推奨品

もっと拡大する!