01-iFIT部署失败故障处理手册
本章节下载: 01-iFIT部署失败故障处理手册 (173.15 KB)
GRPC采集器上未收到iFIT统计信息或者display ifit statistic没有统计数据。
本类故障的常见原因主要包括:
(1) 设备和GRPC采集器之间路由不可达,导致设备上报iFIT统计数据失败。
(2) 设备上的GRPC订阅配置错误,导致设备上报iFIT统计数据失败。
(3) 在SRv6组网中,设备不是SRv6隧道上的节点,不支持iFIT统计。
(4) 设备上的iFIT配置缺失,导致设备上没有生成iFIT统计信息。
(5) 驱动未向iFIT模块上报iFIT统计数据。
(6) iFIT模块未正确处理驱动上报的iFIT统计数据。
本类故障的诊断流程如图1-1所示。
图1-1 iFIT部署失败的故障诊断流程图
(1) 检查设备能否Ping通GRPC采集器。
使用ping命令查看网络连接情况。
¡ 如果不能Ping通,则无法通过GRPC协议将iFIT测量和数据上传给采集器。
¡ 如果Ping不通,请参见“Ping不通问题”继续定位。
(2) 检查设备上的GRPC订阅配置是否正确。
要将iFIT测量数据按周期上传给GRPC采集器,需要在设备上开启GRPC功能,配置GRPC订阅以及采样路径ifit/flowstatistics/flowstatistic。请参考iFIT配置指导中配置举例中的步骤进行配置。
(3) 如果是SRv6组网,检查设备是否在SRv6隧道的SID列表中。
在SRv6/G-SRv6组网中,请将iFIT功能部署在SID List中的节点上。如果中间节点不在SID列表上,该设备不会解析SRv6和iFIT报文头,所以,即使在该设备上配置了iFIT功能,也不进行iFIT测量。
如果设备为中转设备(即不在SID列表上,不解析SRv6报文头)还需要进行iFIT测量,请通过SRv6配置将设备加入SID列表后,再在该设备上开启iFIT测量。
(4) 检查iFIT配置是否正确。
根据节点类型进行相应的配置检查。例如在头节点上执行display ifit flow static命令查看是否创建了静态流。如果显示中Measurement status字段取值:
¡ 为Active,则表示iFIT正在进行测试。需要进一步检查静态流的参数是否符合网络规划,如果不符合网络规划,请参考iFIT配置指导手册修改。例如,测量模式为e2e时,进行端到端测量;测量模式为trace时,才会逐跳测量。
¡ 为Inactive,则表示iFIT当前未在进行测试,大概率存在配置错误。可进一步检查是否绑定VPN、APN6实例以及绑定的实例是否存在,如果不存在,请修改配置。
<Sysname> display ifit flow static flow-id 4097
Instance name : 1
Device ID : 1
Flow ID : 4097
Transmit network type : Tunnel
Flow information:
Flow type : Static
Flow direction : Unidirection
Source IP/mask length : 1.1.1.1/24
Destination IP/mask length : 2.2.2.2/32
Protocol : TCP
Source port : Any
Destination port : Any
DSCP : 23
VPN instance name : --
Measurement information:
Period : 10 sec
Measurement mode : e2e
Loss measurement : Enabled
Delay measurement : Enabled
Measurement configuration : Enabled
Measurement status : Active
Bound interface:
GigabitEthernet2/0/1
在头节点、中间节点、尾节点上可以执行display ifit flow dynamic命令用来显示iFIT动态目标流的相关信息。
¡ 如果没有iFIT动态目标流,则说明未匹配到目标流,可以对报文入方向进行抓包,查看是否收到指定特性的业务报文。如果设备未收到指定特性的业务报文,请先解决业务报文丢包问题。
¡ 如果存在iFIT动态目标流,请按照步骤(5)继续处理。
(5) 检查设备驱动是否上报iFIT统计数据。
在设备上执行display system internal ifit flow命令查看iFIT流信息,如果显示信息中:
¡ RcvCount字段的取值在持续增长,则表示驱动已将iFIT统计数据上报给iFIT模块。
¡ RcvCount字段取值为0、不增长或者增长缓慢远低于业务报文数量,则表示驱动未将iFIT统计数据上报给iFIT模块。可能是设备硬件不支持iFIT测量或者是设备资源不够无法进行iFIT测量。可以执行:
- display logbuffer | include IFIT_NO_SUPPORT命令,查看当前生成的系统日志中时是否存在摘要为IFIT_NO_SUPPORT的日志。如果存在,则表示设备不支持iFIT功能,请更换支持iFIT功能的硬件。如果不存在,则继续定位。
- display logbuffer | include IFIT_NO_RESOURCE命令,查看当前生成的系统日志中时是否存在摘要为IFIT_NO_RESOURCE的日志。如果存在,则表示设备资源不足,无法进行iFIT测量。如果不存在,则继续定位。
<Sysname> display system internal ifit flow slot 2
iFit Kernel flow information:
NodeID FlowID IfIndex RcvCount Smooth Encap Mode Period
1 2 0 2 0 0 0 0
(6) 检查iFIT模块是否正常处理驱动上报的iFIT统计数据。
可以打开iFIT调试信息开关,来进一步定位。为了避免产生的调试信息太多,影响查看。可以先执行debugging ifit error命令,通过调试信息查看是否存在iFIT处理错误的调试信息。如果没有,再执行debugging ifit event命令,通过调试信息查看iFIT模块是否正常处理驱动上报的iFIT统计数据。
如果根据调试信息判断iFIT模块无法正常处理驱动上报的iFIT统计数据,可以执行undo ifit enable重启iFIT功能,或者执行reboot命令重启设备,来尝试恢复故障。
(7) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
无
· IFIT_NO_SUPPORT
· IFIT_NO_RESOURCE
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!