• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

18-故障处理和FAQ

目录

03-H3C无线终端丢包排查

本章节下载 03-H3C无线终端丢包排查  (311.89 KB)

03-H3C无线终端丢包排查

H3C无线终端丢包排查

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,

并不得以任何形式传播。本文档中的信息可能变动,恕不另行通知。

 

 



1 简介

在WLAN网络的使用过程中,有时会发现无线终端在Ping其他设备时出现连续丢包,同时可能还伴随着Ping延时增大(几百毫秒)、下载速度变慢、视频出现抖动等,导致无线终端用户的使用体验变差,这种情况是WLAN网络中比较棘手的问题。一方面WLAN网络本身使用的是一个复杂的、不容易评估的空间媒介,因此会导致空口的不稳定;另一方面还要综合考虑整个有线、无线网络的网络配置和性能等问题。

1.1  故障排查思路

图1-1所示,在一个典型的WLAN网络中,当无线客户端Ping服务器丢包严重时,需要按照报文转发途经来排查丢包的原因。

图1-1 AC+Fit AP组网示意图

 

 

故障排查的思路为:

(1)     测试无线终端的丢包率;

(2)     判断AC连接AP的有线网络是否存在丢包问题;

(3)     判断无线终端能否正常连接到网络、获取IP地址;

(4)     判断无线终端状态、空口利用率、空口质量、底噪是否正常;

(5)     通过收集Debug信息分析问题原因。

1.2  故障排查步骤

1.2.1  测试无线终端丢包率

通过Ping操作测试当前网络丢包的类型,判断是随机性时断时通,还是连续有规律的丢包。

说明

从目前的协议分析和实际应用来看,无线网络无法实现真正的零丢包。空口利用率正常、无干扰的情况下,3%以内的无规律丢包是可以接受的范围。

 

例如:

D:\>Ping 192.168.1.3

 

Pinging 192.168.1.3 with 32 bytes of data:

 

Reply from 192.168.1.3: bytes=32 time=19ms TTL=255

Reply from 192.168.1.3: bytes=32 time=4ms TTL=255

Reply from 192.168.1.3: bytes=32 time=3ms TTL=255

Reply from 192.168.1.3: bytes=32 time=4ms TTL=255

 

Ping statistics for 192.168.1.3:

    Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),

Approximate round trip times in milli-seconds:

    Minimum = 3ms, Maximum = 19ms, Average = 7ms

1.2.2  判断AC连接AP的有线网络是否正常

1. 如果AC不作为网关,则需要在无线终端上Ping AC的IP地址进行测试

如果Ping网关异常但是Ping AC正常,则需要排查AC至网关的二层网络是否正常。

如果Ping网关和AC均异常,则需要排查有线网络丢包。

2. 如果无线终端在线

如果无线终端在线则直接通过命令行查询当前AP地址,然后通过AC Ping AP判断AC到AP的有线网络链路状态:

(1)     通过命令display wlan client中的AP name字段查找当前无线终端所连接AP的名称。

(2)     通过命令display wlan ap查看无线终端当前连接接AP的IP地址。

例如:通过命令查看,可以确认AP1的IP地址为192.168.1.6,在线时长为22个小时,如果在线时间很短,则证明AP注册存在问题,需要关注排查AP注册存在的问题。

[AC]display wlan ap name ap1 verbose

……

 Up Time(hh:mm:ss)             : 22:06:21

……

 IP Address                    : 192.168.1.6

(3)     在AC上Ping AP的IP地址,观察网络质量,可以确认AC到AP这段有线网络是否正常。

3. 如果无线终端不在线则排查有线网络丢包

通过逐级Ping、抓包方式明确具体丢包的位置,再检查二层、三层网络配置是否符合规范。

1.2.3  排查无线接入问题

(1)     排查无线终端配置

·     检查终端无线网卡是否正常打开。

·     检查是否在终端服务中开启无线服务,例如Windows操作系统中,要开启Wireless Zero Configuration。

·     检查无线终端是否工作在正常的无线终端模式,如果错误的设置成AP模式则无法作为无线终端使用。

·     检查无线终端是否关联正确的SSID。

(2)     在AC上通过命令display wlan client查看无线终端是否关联到AP。

1.2.4  排查DHCP问题

在无线终端上查看无线终端是否获取到正确的IP地址,例如,在PC上执行:开始>运行>输入cmd回车,通过命令ipconfig/all,在手机或者PAD上在网络状态中查看IP地址获取情况。

1.2.5  判断无线终端在线状态是否正常

通过命令display wlan client verbose查看,可以确认无线终端是否正常上线。

例如:

[AC] display wlan client mac-address 0024-d79c-af4c verbose

 Total number of clients: 1

 MAC address                        : 000f-e265-6400

……

 SM power save                      : Enabled

……

 RSSI                               : 62

 Rx/Tx rate                         : 130/195 Mbps

……

 Online time                        : 0days 0hours 1minutes 13seconds

(1)     SM power save表示无线终端省电模式状态,当无线终端处于休眠状态则Ping延时会比较大,一般会大于Beacon间隔时间。

(2)     RSSI表示AP收到的无线终端信号强度,信号强度应该尽量达到30之上。无线用户的信号强度RSSI偏低(低于25),则需要分析一下该用户状态以及对整个网络的影响,尽量提高无线用户的信号强度,可以通过调整天线、增加AP的方式改善信号覆盖。

(3)     Rx/Tx Rate,如果Rx Rate始终保持在较低速率(例如1、2、11),通常说明空口环境不是特别好、甚至丢包比较多,需要进行空口的分析(例如信道占用情况、确认网络流量),适当进行流量控制或者无线用户的限速。

(4)     Online time表示用户在线时间,如果时间比较短,而该用户已经长时间使用无线网络,需要考虑该用户是否出现过漫游,可以适当的调整这台客户端连接的AP的发射功率减少用户的漫游,或者将网卡的漫游主动性调低。

1.2.6  判断无线空口利用率是否正常

(1)     通过命令display wlan client中的AP name字段查找当前无线终端所连接AP的名称。

(2)     通过命令display wlan ap查看无线终端当前连接AP的IP地址。

(3)     通过在Probe视图下执行命令wlan ap-execute ap-name exec-control enable打开Fit AP远程登录开关。

(4)     通过在AC上Telnet,可以登录到无线终端所关联的Fit AP上,Password输入h3capadmin。

(5)     通过命令display ar5drv radio channelbusy(radio表示射频接口号,单频AP则只有一个射频口,双频AP则Radio 1表示5G射频,Radio 2表示2.4G射频)查看信道利用率,判断射频繁忙情况。

例如:通过命令查看,AP的5G射频目前处于正常状态,当CtlBusy高于60时,则表示该射频繁忙。

System View: return to User View with Ctrl+Z.

[AP] probe

[AP-probe] display ar5drv 1 channelbusy

ChannelBusy information

 Ctl Channel:    149    Channel Band: 40M

 Ext Channel:        Above

 Record Interval(s):  9

 Date/Month/Year: 03/05/2019

      Time(h/m/s):   CtlBusy(%) TxBusy(%)  RxBusy(%)  ExtBusy(%)

 01   11:18:35       68         37         28         0

 02   11:18:26       67         36         29         0

 03   11:18:17       63         35         26         0

 04   11:18:08       78         40         33         0

 05   11:17:59       81         43         36         0

 …

(6)     通过命令display ar5drv radio statistics (radio表示射频接口号,单频AP则只有一个射频口,双频AP则Radio 1表示5G射频,Radio 2表示2.4G射频)查看AP射频统计情况,判断空口质量。

[AP-probe] display ar5drv 1 statistics

 RxResetTgtChipCnts  : 0

Radio statistics:

 TxFrameAllCnt       : 40693

 TxFrameAllBytes     : 7293360

 

Queue statistics

 Queue Number :0     1      2     3      Mgmt     EmergencyQ CAB

 ----------------------------------------------------------------

 TxFrmCnt     :152   5745   0     0      1883     2729       0

 TxUcastFrmCnt:152   3780   0     0 1883     0          0

 …

 TxDiscardFrm :2     4      0     0      31       2          0

 …

 RadioResetOnErr     : 0

 …

 BeaconBusyCnt      : 2

 BeaconErrCnt       : 0

 …

a.     每个Radio有4个普通发送队列和1个紧急发送队列,通常数据报文都走1号队列。通常我们主要关注1号队列。

b.     TxDiscardFrm表示此队列丢弃的报文总数,包括发送失败和队列溢出的报文。

c.     TxFrmCnt/TxUcastFrmCnt表示丢包率,如果超过了3%,则需要重点关注。

d.     RadioResetOnErr表示Radio芯片复位,会导致丢包,正常情况下不会出现这个错误。

e.     BeaconBusyCnt和BeaconErrCnt表示AP发送Beacon报文的繁忙程度及错误统计,可以判断空口的质量,如果出现增长则会出现丢包现象。

1.2.7  排除空口干扰降低底噪干扰

(1)     AP上查看底噪是否正常

通过命令display ar5drv radio calibration查看底噪信息,当Value值高于-80的时候就需要警惕,可借助仪器分析原因。

[AP-probe] display ar5drv 1 calibration

Calibration Information:

 Calibration Enable:  YES

 Calibration Interval:  1000     Reset Radio Count:  0

 iqCalState:       CAL_DONE      I:  62/60/58, Q:  -4/0/-2

 iqCalValid:       True

 NoiseFloor:       -93

 CCA Info:

 5GMaxCca:         -50

 5GMinCca:         -122

 5GNormCca:        -112

 NF Record:

 Num:   NF Value         time

  0     -93              17:54:43:038 10/05/2019

  1     -93              17:54:44:038 10/05/2019

  2     -93              17:54:45:038 10/05/2019

(2)     借助分析工具分析

可以使用黄马甲测试仪,IEEE 802.11b/g版本及以上的黄马夹是支持用户检查和确定AP和RSSI信号电平、全频谱扫描等内容。或者使用频谱仪频谱(Spectrum)模式可以对测试点进行频谱与干扰分析。

1.2.8  收集无线终端抓包、空口抓包、Debug信息

如果无线终端可以抓包则不需要空口抓包,如果是说明、证明问题,则需要进行空口抓包,如果无线终端不支持抓包,则需要进行空口抓包。

1. 无线终端抓包

无线终端抓包推荐使用Wireshark/Ethereal进行抓包,需要注意的是:

(1)     为了便于抓包分析,可以在无线客户端Ping固定大小的报文,例如130bytes。

(2)     提供抓包信息时,收集抓包信息后一定要提供无线客户端的MAC地址和IP地址。

(3)     报文分析时可以根据报文大小,确定是否每一个Ping Request报文都很快有Ping Reply回应消息。

(4)     如果无线终端和空口均进行抓包,可以通过Ping报文的序列号进行匹配分析,确定两个抓包的相对时间进行对比分析,确定延时情况和报文丢失情况。

(5)     在无线笔记本上使用Ethereal进行抓包。

2. 空口抓包

可以使用Omnipeek/Airmagnet进行空口抓包,需要注意的是:

(1)     抓包工具不一定能够将所有的空口报文都抓上来,也就是在分析过程中要充分考虑到可能偶尔有报文接收不上来的情况;

(2)     无论使用哪种工具进行抓包,一定要选择当前无线终端所在的信道进行抓包;

(3)     Ping有两个方向,一个为Ping Request从无线终端到AP,另外一个为Ping Reply从AP到无线终端;

(4)     为了报文方便分析,可以Ping指定大小的报文,例如130bytes;特别对于加密接入的客户端一定要采用Ping固定长度的报文。

3. 抓包结果分析

(1)     如果收不到ACK确认(无线终端没有发送ACK,或者AP没有收到无线终端发送的ACK),则会进行报文重传。

(2)     AP设备默认重传次数为5次,无线终端重传次数不定,与无线终端型号有关。

(3)     如果抓包中连续出现多个相同的重传报文,而没有ACK报文,说明该报文可能丢失。

(4)     根据报文的MAC地址,可以确定是AP到无线终端丢失还是无线终端到AP丢失。

1.2.9  登录AP开启debugging信息

(1)     通过命令display wlan client中的AP name字段查找当前无线终端所连接AP的名称。

(2)     通过命令display wlan ap查看无线终端当前连接接AP的IP地址。

(3)     通过在Probe视图下执行命令wlan ap-execute ap-name exec-control enable打开Fit AP远程登录开关。

(4)     通过在AC上Telnet,可以登录到无线终端所关联的Fit AP上,Password输入h3capadmin。

在Fit AP的Probe视图执行命令debugging ar5drv radio phy packet all,用户视图执行命令terminal monitorterminal debugging,可以开启Debug。

注意

开启Debug之前,使用无线终端长Ping网关。检查CPU和内存的使用情况,确保开启Debug不会影响设备的正常运行,收集完信息后请及时关闭Debug。

 

 

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们