03-典型故障案例
本章节下载: 03-典型故障案例 (1.04 MB)
目 录
2.2.2 新老软件版本跨度过大时,升级失败但设备能正常启动的处理步骤
2.2.3 新老软件版本跨度过大时,软件升级失败且设备无法正常启动的处理步骤
5 设备与华为交换机P2P类型网络下的OSPFv3协议对接,邻居无法建立
8 设备接口物理状态UP/DOWN后查看相应的Trap信息没有具体的接口编号
9 设备与思科N9000 IS-IS协议对接,双方配置相同,但IS-IS邻居无法建立
10 设备上100GE以太网接口上可插拔QSFP-100G-ER4L-WDM1300光模块的发送与接收功率处于正常状态,但是接口无法正常通信
配置三层聚合子接口的VLAN终结功能时,设备提示资源不足,如下所示:
[Sysname-Route-Aggregation1.1000] vlan-type dot1q vid 1000 to 1500 second-dot1q 3000 to 3300
Not enough resources to complete the operation.
(1) 根据提示信息“Not enough resources to complete the operation”,初步判断命令行无法下发是因系统资源不足导致。
(2) 查看设备上存在的业务板。
<Sysname> display device
Slot No. Brd Type
Brd Status Software Version
0 AAA Master TEMP
1 NONE Absent NONE
2 BBB Normal TEMP
3 NONE Absent NONE
4 NONE Absent NONE
5 NONE Absent NONE
6 CCC Normal TEMP
7 NONE Absent NONE
8 NONE Absent NONE
9 NONE Absent NONE
说明:以上显示信息仅为示例,并非设备实际的软、硬件信息。
(3) 通过咨询技术人员获取2号槽位单板支持的VLAN终结表项规格。
(4) 根据三层以太网子接口/三层聚合子接口VLAN终结占用表项计算方法,每个三层以太网子接口/三层聚合子接口的VLAN终结占用表项数目=三层以太网子接口/三层聚合子接口包含的物理接口数目*外层Tag范围*内层Tag范围。本案例中,三层聚合子接口VLAN终结表项数目=4*(1500-1000)*(3300-3000)=600000(600K),超出2号槽位单板支持的VLAN终结表项规格。
(5) 得出结论:三层聚合子接口上配置的VLAN终结表项数目超出最大规格。
配置的VLAN终结占用表项数量大于单板支持的最大终结表项规格,因此VLAN终结功能无法配置。
由于该问题属于单板规格类问题,可以通过优化组网,使三层聚合子接口上配置的VLAN终结表项数目在规格范围内。
如果设备有多个三层聚合子接口,那么同一单板上物理接口所属的所有三层聚合子接口VLAN终结表项数目之和不能超过该单板的VLAN终结表项规格。
在设备上使用boot-loader file命令配置设备下次启动时使用的软件包,当软件包版本与设备当前版本的跨度过大时,重启后可能出现如下问题:
· 设备成功启动且运行正常,但是运行的版本仍为升级前的版本。
· 设备无法正常启动。
以下显示信息仅为示例,请以设备实际的软、硬件信息为准。
新老软件版本跨度过大时,按照如下步骤操作,可以成功升级软件。
(1) 使用FTP、TFTP方式将新软件包下载到任一文件系统的根目录下。(略)
(2) 通过display version命令查看设备当前的BootWare版本。可以看到当前设备的软件版本。
<H3C> display version
H3C Comware Software, Version 7.1.048, Release 7143
Copyright (c) 2004-2014 Hangzhou H3C Tech. Co., Ltd. All rights reserved.
H3C SR8812-F uptime is 0 weeks, 0 days, 0 hours, 28 minutes
Last reboot reason : USER reboot
Boot image: cfa0:/SR8800-CMW710-BOOT-R7143.bin
Boot image version: 7.1.048, Release 7143
Compiled Nov 18 2014 17:07:41
System image: cfa0:/SR8800-CMW710-SYSTEM-R7143.bin
System image version: 7.1.048, Release 7143
Compiled Nov 18 2014 17:07:41
MPU(M) 0:
Uptime is 0 weeks,0 days,0 hours,28 minutes
BOARD TYPE: SR07SRPUB1
DRAM: 4096M bytes
CFCARD: 4002M bytes
PCB 1 Version: VER.A
Bootrom Version: 116
CPLD 1 Version: 001
CPLD 2 Version: 001
Release Version: H3C SR8812-F-7143
Patch Version : None
Reboot Cause : UserReboot
Number of Exist Subcards: 0
LPU 3:
Uptime is 0 weeks,0 days,0 hours,26 minutes
BOARD TYPE: MPE-1104
DRAM: 2048M bytes
PCB 1 Version: VER.A
PCB 2 Version: VER.A
Bootrom Version: 124
CPLD 1 Version: 001
Release Version: H3C SR8812-F-7143
Patch Version : None
Reboot Cause : UserReboot
Number of Exist Subcards: 4
Subcard 1 :
Exist : N
Subcard 2 :
Exist : Y
Type : MIC-GP8L
PCB : Ver.A
Number of Cpld: 1
Cpld 0:
SoftWare : 001
Number of Fpga: 0
Subcard 3 :
Exist : N
Subcard 4 :
Exist : N
(3) 根据表格查找当前BootWare版本支持的IPE包大小的最大值,1.16版本最大支持512M的IPE包。
表2-1 不同BootWare版本支持的IPE包大小的最大值
BootWare版本 |
描述 |
1.12及以下 |
最大支持256M的IPE包 |
1.13~1.38 |
最大支持512M的IPE包 |
1.39~最新 |
最大支持1G的IPE包 |
(4) 判断新版本软件包的大小是否超过当前BootWare版本支持的上限,选择相应的升级方式。
¡ 如果新版本软件包的大小没有超过当前BootWare版本支持的上限,则可直接通过boot-loader file命令配置设备下次启动时使用的软件包
¡ 如果如果新版本软件包的大小超过了当前BootWare版本支持的上限,则需先通过可直接通过bootrom update命令加载最新版本的BootWare程序,再通过boot-loader file命令配置设备下次启动时使用的软件包。
(5) 通过bootrom update命令加载BootWare程序。(仅新版本软件包的大小超过当前BootWare版本支持的上限时,需要配置本步骤。)
# 配置bootrom update命令加载BootWare程序。
<Sysname> bootrom update file cfa0:/SR8800-CMW710-BOOT-NEW.bin slot 1
This command will update the Boot ROM file on the specified board(s), Continue? [Y/N]:y
Now updating the Boot ROM, please wait...
.............Done.
# 重启设备,完成BootWare程序的加载。
<Sysname> reboot
Start to check configuration with next startup configuration file, please wait..
.......DONE!
Current configuration may be lost after the reboot, save current configuration?
[Y/N]:y
Please input the file name(*.cfg)[cfa0:/config.cfg]
(To leave the existing filename unchanged, press the enter key):
cfa0:/spp.cfg exists, overwrite? [Y/N]:y
Validating file. Please wait...
Saved the current configuration to mainboard device successfully.
This command will reboot the device. Continue? [Y/N]:y
Now rebooting, please wait...
(6) 通过boot-loader file命令配置设备下次启动时使用的软件包。
<Sysname> boot-loader file cfa0:/SR8800.ipe all main
Verifying the file cfa0:/SR8800.ipe on slot 0...................................
...........Done.
H3C SR8812-F images in IPE:
SR8800-CMW710-BOOT-NEW.bin
SR8800-CMW710-SYSTEM-NEW.bin
This command will set the main startup software images. Continue? [Y/N]:y
Add images to slot 0.
File cfa0:/SR8800-CMW710-BOOT-NEW.bin already exists on slot 0.
Overwrite the existing files? [Y/N]:y
Decompressing file SR8800-CMW710-BOOT-NEW.bin to cfa0:/SR8800-CMW710-BOOT-E830
5.bin..Done.
Decompressing file SR8800-CMW710-SYSTEM-NEW.bin to cfa0:/SR8800-CMW710-SYSTEM-
E8305.bin...Done.
Verifying the file cfa0:/SR8800-CMW710-BOOT-NEW.bin on slot 0.....Done.
Verifying the file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin on slot 0...............
...........................Done.
The images that have passed all examinations will be used as the main startup so
ftware images at the next reboot on slot 0.
Decompression completed.
Do you want to delete cfa0:/SR8800.ipe now? [Y/N]:n
(7) 重启设备,完成软件升级。
<Sysname> reboot
Start to check configuration with next startup configuration file, please wait..
.......DONE!
Current configuration may be lost after the reboot, save current configuration?
[Y/N]:y
Please input the file name(*.cfg)[cfa0:/config.cfg]
(To leave the existing filename unchanged, press the enter key):
cfa0:/spp.cfg exists, overwrite? [Y/N]:y
Validating file. Please wait...
Saved the current configuration to mainboard device successfully.
This command will reboot the device. Continue? [Y/N]:y
Now rebooting, please wait...
当软件包版本与设备当前版本的跨度过大时,没有预先通过bootrom update命令加载BootWare程序,加载版本且重启后设备正常启动但是设备版本仍为加载前的版本,处理方式如下:
(1) 使用FTP、TFTP方式将新软件包下载到任一文件系统的根目录下。(略)
(2) 通过bootrom update命令加载BootWare程序。
<Sysname> bootrom update file cfa0:/SR8800-CMW710-BOOT-NEW.bin slot 1
This command will update the Boot ROM file on the specified board(s), Continue? [Y/N]:y
Now updating the Boot ROM, please wait...
.............Done.
(3) 重启设备,完成BootWare程序的加载。
<Sysname> reboot
Start to check configuration with next startup configuration file, please wait..
.......DONE!
Current configuration may be lost after the reboot, save current configuration?
[Y/N]:y
Please input the file name(*.cfg)[cfa0:/config.cfg]
(To leave the existing filename unchanged, press the enter key):
cfa0:/spp.cfg exists, overwrite? [Y/N]:y
Validating file. Please wait...
Saved the current configuration to mainboard device successfully.
This command will reboot the device. Continue? [Y/N]:y
Now rebooting, please wait...
(4) 通过boot-loader file命令配置设备下次启动时使用的软件包。
<Sysname> boot-loader file cfa0:/SR8800.ipe all main
Verifying the file cfa0:/SR8800.ipe on slot 0...................................
...........Done.
H3C SR8812-F images in IPE:
SR8800-CMW710-BOOT-NEW.bin
SR8800-CMW710-SYSTEM-NEW.bin
This command will set the main startup software images. Continue? [Y/N]:y
Add images to slot 0.
File cfa0:/SR8800-CMW710-BOOT-NEW.bin already exists on slot 0.
Overwrite the existing files? [Y/N]:y
Decompressing file SR8800-CMW710-BOOT-NEW.bin to cfa0:/SR8800-CMW710-BOOT-E830
5.bin..Done.
Decompressing file SR8800-CMW710-SYSTEM-NEW.bin to cfa0:/SR8800-CMW710-SYSTEM-
E8305.bin...Done.
Verifying the file cfa0:/SR8800-CMW710-BOOT-NEW.bin on slot 0.....Done.
Verifying the file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin on slot 0...............
...........................Done.
The images that have passed all examinations will be used as the main startup so
ftware images at the next reboot on slot 0.
Decompression completed.
Do you want to delete cfa0:/SR8800.ipe now? [Y/N]:n
(5) 重启设备,完成软件升级。
<Sysname> reboot
Start to check configuration with next startup configuration file, please wait..
.......DONE!
Current configuration may be lost after the reboot, save current configuration?
[Y/N]:y
Please input the file name(*.cfg)[cfa0:/config.cfg]
(To leave the existing filename unchanged, press the enter key):
cfa0:/spp.cfg exists, overwrite? [Y/N]:y
Validating file. Please wait...
Saved the current configuration to mainboard device successfully.
This command will reboot the device. Continue? [Y/N]:y
Now rebooting, please wait...
当软件包版本与设备当前版本的跨度过大时,没有预先通过bootrom update命令加载BootWare程序,加载版本且重启后设备无法正常启动,处理方式如下:
(1) 通过console口登录设备,在设备启动的过程中输入输入<Ctrl+B>进入BOOTWARE界面。然后输入7,选择BootWare选项菜单。
==========================<EXTENDED-BOOTWARE MENU>==========================
|<1> Boot System |
|<2> Enter Serial SubMenu |
|<3> Enter Ethernet SubMenu |
|<4> File Control |
|<5> Restore to Factory Default Configuration |
|<6> Skip Current System Configuration |
|<7> BootWare Operation Menu |
|<8> Skip Authentication for Console Login |
|<9> Storage Device Operation |
|<0> Reboot |
============================================================================
Ctrl+C: Display Copyright
Ctrl+F: Format File System
Enter your choice(0-9): 7
(2) 输入4,选择通过以太网的方式升级BootWare。
=========================<BootWare Operation Menu>==========================
|Note:the operating device is cfa0 |
|<1> Backup Full BootWare |
|<2> Restore Full BootWare |
|<3> Update BootWare By Serial |
|<4> Update BootWare By Ethernet |
|<0> Exit To Main Menu |
============================================================================
Enter your choice(0-4): 4
(3) 输入4,选择修改以太网参数。
===================<BOOTWARE OPERATION ETHERNET SUB-MENU>===================
|<1> Update Full BootWare |
|<2> Update Extended BootWare |
|<3> Update Basic BootWare |
|<4> Modify Ethernet Parameter |
|<0> Exit To Main Menu |
============================================================================
Enter your choice(0-4): 4
==========================<ETHERNET PARAMETER SET>==========================
|Note: '.' = Clear field. |
| '-' = Go to previous field. |
| Ctrl+D = Quit. |
============================================================================
Protocol (FTP or TFTP) :tftp
Load File Name :SR8800.ipe
:SR8800-CMW710-BOOT-NEW.bin
Target File Name :SR8800.ipe
:SR8800-CMW710-BOOT-NEW.bin
Server IP Address :192.168.2.26
Local IP Address :192.168.2.88
Subnet Mask :255.255.255.0
Gateway IP Address :0.0.0.0
(4) 输入1,上传BootWare软件。
===================<BOOTWARE OPERATION ETHERNET SUB-MENU>===================
|<1> Update Full BootWare |
|<2> Update Extended BootWare |
|<3> Update Basic BootWare |
|<4> Modify Ethernet Parameter |
|<0> Exit To Main Menu |
============================================================================
Enter your choice(0-4): 1
Loading.....................................................................
.............................................................Done.
41560064 bytes downloaded!
Updating Basic BootWare? [Y/N]Y
Updating Basic BootWare.........Done.
Updating Extended BootWare? [Y/N]Y
Updating Extended BootWare.........Done.
(5) 重启设备,完成BootWare程序的加载。
===================<BOOTWARE OPERATION ETHERNET SUB-MENU>===================
|<1> Update Full BootWare |
|<2> Update Extended BootWare |
|<3> Update Basic BootWare |
|<4> Modify Ethernet Parameter |
|<0> Exit To Main Menu |
============================================================================
Enter your choice(0-4): 0
=========================<BootWare Operation Menu>==========================
|Note:the operating device is cfa0 |
|<1> Backup Full BootWare |
|<2> Restore Full BootWare |
|<3> Update BootWare By Serial |
|<4> Update BootWare By Ethernet |
|<0> Exit To Main Menu |
============================================================================
Enter your choice(0-4): 0
==========================<EXTENDED-BOOTWARE MENU>==========================
|<1> Boot System |
|<2> Enter Serial SubMenu |
|<3> Enter Ethernet SubMenu |
|<4> File Control |
|<5> Restore to Factory Default Configuration |
|<6> Skip Current System Configuration |
|<7> BootWare Operation Menu |
|<8> Skip Authentication for Console Login |
|<9> Storage Device Operation |
|<0> Reboot |
============================================================================
Ctrl+C: Display Copyright
Ctrl+F: Format File System
Enter your choice(0-9): 0
(6) 在设备完成重启后,输入3,进入以太网子菜单。
==========================<EXTENDED-BOOTWARE MENU>==========================
|<1> Boot System |
|<2> Enter Serial SubMenu |
|<3> Enter Ethernet SubMenu |
|<4> File Control |
|<5> Restore to Factory Default Configuration |
|<6> Skip Current System Configuration |
|<7> BootWare Operation Menu |
|<8> Skip Authentication for Console Login |
|<9> Storage Device Operation |
|<0> Reboot |
============================================================================
Ctrl+Z: Access EXTENDED ASSISTANT MENU
Ctrl+C: Display Copyright
Ctrl+F: Format File System
Enter your choice(0-9): 3
(7) 输入5,选择修改以太网参数。
==========================<Enter Ethernet SubMenu>==========================
|Note:the operating device is cfa0 |
|<1> Download Image Program To SDRAM And Run |
|<2> Update Main Image File |
|<3> Update Backup Image File |
|<4> Download Files(*.*) |
|<5> Modify Ethernet Parameter |
|<0> Exit To Main Menu |
|<Ensure The Parameter Be Modified Before Downloading!> |
============================================================================
Enter your choice(0-5): 5
==========================<ETHERNET PARAMETER SET>==========================
|Note: '.' = Clear field. |
| '-' = Go to previous field. |
| Ctrl+D = Quit. |
============================================================================
Protocol (FTP or TFTP) :tftp
Load File Name :SR8800-CMW710-BOOT-NEW.bin
:SR8800.ipe
Target File Name :SR8800-CMW710-BOOT-NEW.bin
:SR8800.ipe
Server IP Address :192.168.2.26
Local IP Address :192.168.2.88
Subnet Mask :255.255.255.0
Gateway IP Address :0.0.0.0
(8) 输入2,配置设备下次启动时使用的主用软件包。
==========================<Enter Ethernet SubMenu>==========================
|Note:the operating device is cfa0 |
|<1> Download Image Program To SDRAM And Run |
|<2> Update Main Image File |
|<3> Update Backup Image File |
|<4> Download Files(*.*) |
|<5> Modify Ethernet Parameter |
|<0> Exit To Main Menu |
|<Ensure The Parameter Be Modified Before Downloading!> |
============================================================================
Enter your choice(0-5): 2
Loading.....................................................................Done.
644700160 bytes downloaded!
The file is exist,will you overwrite it? [Y/N]Y
Image file SR8800-CMW710-BOOT-NEW.bin is self-decompressing...
Saving file cfa0:/SR8800-CMW710-BOOT-NEW.bin ........Done.
Image file SR8800-CMW710-SYSTEM-NEW.bin is self-decompressing...
Saving file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin ........Done.
(9) 先后输入0和1,直接加载新软件,设备开始启动,启动后完成升级。
==========================<Enter Ethernet SubMenu>==========================
|Note:the operating device is cfa0 |
|<1> Download Image Program To SDRAM And Run |
|<2> Update Main Image File |
|<3> Update Backup Image File |
|<4> Download Files(*.*) |
|<5> Modify Ethernet Parameter |
|<0> Exit To Main Menu |
|<Ensure The Parameter Be Modified Before Downloading!> |
============================================================================
Enter your choice(0-5): 0
==========================<EXTENDED-BOOTWARE MENU>==========================
|<1> Boot System |
|<2> Enter Serial SubMenu |
|<3> Enter Ethernet SubMenu |
|<4> File Control |
|<5> Restore to Factory Default Configuration |
|<6> Skip Current System Configuration |
|<7> BootWare Operation Menu |
|<8> Skip Authentication for Console Login |
|<9> Storage Device Operation |
|<0> Reboot |
============================================================================
Ctrl+Z: Access EXTENDED ASSISTANT MENU
Ctrl+C: Display Copyright
Ctrl+F: Format File System
Enter your choice(0-9): 1
Loading the main image files...
Loading file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin.............Done.
Loading file cfa0:/SR8800-CMW710-BOOT-NEW.bin...........Done.
Image file cfa0:/SR8800-CMW710-BOOT-NEW.bin is self-decompressing......Done.
System image is starting...
Line con0 is available.
Press ENTER to get started.
******************************************************************************
* Copyright (c) 2004-2021 New H3C Technologies Co., Ltd. All rights reserved.*
* Without the owner's prior written consent, *
* no decompiling or reverse-engineering shall be allowed. *
******************************************************************************
<Sysname>
老版本的Bootware程序支持的IPE包的规格较小,新版本的IPE包的大小超过了老版本的Bootware程序的规格。
新老软件版本跨度过大时,由于Bootware程序的版本与用户需要加载的IPE包的版本不兼容会导致升级失败,可以通过加载新版本的Bootware程序来解决。如果升级失败后设备无法正常启动,可以通过console口登录设备,在设备启动的过程进入BOOTWARE界面来恢复设备。
配置NQA track与静态路由联动时,Track状态切换正常,但是联动静态路由无法失效,导致路由无法正常切换。
(1) 查看设备的Track状态,发现Track状态已经切换至Negative状态,切换正常。
<Sysname> display track 2
Track ID: 2
State: Negative
Duration: 0 days 0 hours 1 minutes 18 seconds
Tracked object type: NQA
Notification delay: Positive 0, Negative 0 (in seconds)
Tracked object
NQA entry: admin admin2
Reaction: 2
Remote IP/URL: 192.168.1.5
Local IP: 183.207.34.81
Interface: --
(2) 查看设备的路由信息,联动的静态路由未失效,即静态路由与Track联动未生效。
<Sysname> display ip routing-table vpn-instance JiaSu2
Destinations : 21 Routes : 21
Destination/Mask Proto Pre Cost NextHop Interface
0.0.0.0/0 Static 60 0 183.207.34.82 XGE3/1/5
0.0.0.0/32 Direct 0 0 127.0.0.1 InLoop0
……
(1) 首先查看设备静态路由配置,发现设备有3条Track联动静态路由的配置,而根据用户反馈只有Track 2不生效,通过查看静态路由配置未发现异常。
<Sysname> display current-configuration | include route-static
ip route-static vpn-instance JiaSu1 0.0.0.0 0 183.207.34.98 preference 65 description Jiasu1-bei
ip route-static vpn-instance JiaSu1 0.0.0.0 0 183.207.34.74 description JiaSu1-zhu track 1
ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.106 preference 65 description JiaSu2-bei
ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 preference 30 description JiaSu2-zhu track 2
ip route-static vpn-instance JiaSu3 0.0.0.0 0 183.207.34.90 description JiaSu3-zhu track 3
ip route-static vpn-instance JiaSu3 0.0.0.0 0 183.207.34.114 preference 65 description Jiasu3-be
(2) 进一步分析Track的状态,发现Track状态改变了一分钟多,但是没通知到对应的模块。
<Sysname> display track 2
Track ID: 2
State: Negative
Duration: 0 days 0 hours 1 minutes 18 seconds
Tracked object type: NQA
Notification delay: Positive 0, Negative 0 (in seconds)
Tracked object
NQA entry: admin admin2
Reaction: 2
Remote IP/URL: 192.168.1.5
Local IP: 183.207.34.81
Interface: --
(3) 在设备上实际配置,输入配置的时候发现问题:先配置description,后配置track,这种配置实际上JiaSu2-zhu track 2整个内容都属于description的描述内容,非真正关联了Track,从而导致未生效。即并非仅Track 2不生效,实际上是三个Track都不生效。
<Sysname> system-view
[Sysname] ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 description JiaSu2-zhu track 2 ?
TEXT Route description (up to 150 characters)
<cr>
正确配置是先配置track,后配置description,修改成下面的配置后功能正常。
ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 track 2 description JiaSu2-zhu
ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 track 2 preference 30 description JiaSu2-zhu
ip route-static vpn-instance JiaSu3 0.0.0.0 0 183.207.34.90 track 3 description JiaSu3-zhu
设备上先后插入两块主控板,先插入的主用主控板正常启动,后插入的备用主控板状态一直处于Fault状态。
(1) 检查设备供电功率。
检查设备的供电功率是否充足,如不足,请提高设备的供电功率。
(2) 单独启动备用主控板。
拔出主用主控板,单独使用备用主控板重新启动设备,发现设备能正常启动,并且单板状态正常。
(3) 检查主控板的软件版本。
查看步骤(2)中备用主控版本启动的软件版本,发现与主用主控板的软件版本不一致。说明主用主控版本的软件版本未同步到备用主控板上。
主备主控板的启动软件版本不一致,且软件版本差异较大,导致备用主控板的软件版本无法同步,启动失败。
对于软件版本跨度较小的主备主控板,备用主控板可直接从主用主控板同步软件版本。
单独更新备用主控板的软件版本,将软件版本更新成与主用主控板的一致。
配置SR8800-F与华为交换机进行P2P类型网络下的OSPFv3协议对接时,邻居建立不起来,邻居状态一直处于INIT状态。组网环境如图5-1所示。
图5-1 OSPFv3协议对接组网图
(1) 在Router-ID为1.1.1.1的设备上执行display ospfv3 peer命令,查看设备的邻居,发现与其建立邻居的设备是Router-ID为2.2.2.2的设备,但邻居状态一直处于INIT状态。
<Sysname> display ospfv3 peer
OSPFv3 Process 1 with Router ID 1.1.1.1
Area: 0.0.0.0
-------------------------------------------------------------------------
Router ID Pri State Dead-Time InstID Interface
2.2.2.2 1 Init/ - 00:00:32 0 Vlan16
(2) 在Router-ID为2.2.2.2的设备上执行display ospfv3 peer命令,查看设备的邻居,发现邻居是Router-ID为3.3.3.3的设备,且邻居状态处于Full状态。
<Sysname> display ospfv3 peer
OSPFv3 Process 1 with Router ID 2.2.2.2
Area: 0.0.0.0
-------------------------------------------------------------------------
Router ID Pri State Dead-Time InstID Interface
3.3.3.3 1 Full/ - 00:00:32 0 Vlan16
(3) 在Router-ID为2.2.2.2的设备上进行报文抓包,发现设备可以接收到其他三台设备发送的Hello报文。在其他三台设备上抓包,发现只有Router-ID为3.3.3.3的设备会收到来自Router-ID为2.2.2.2的设备的Hello报文。因为这个原因导致Router-ID为1.1.1.1的设备与Router-ID为2.2.2.2的设备无法建立起邻居关系。
(4) 通过配置SR8800-F和华为交换机互连的接口与华为交换机之间互连的接口分别属于不同VLAN后,相互之间可以建立OSPFv3邻居,问题解决。
华为交换机互连的二层接口以及与SR8800-F互连的二层接口都属于VLAN 16,故所有设备都处于一个广播域中。当所有设备处于一个广播域时,由于配置的是OSPFv3网络类型为P2P,导致OSPFv3邻居的建立与Hello报文接收的先后顺序强相关。
如图5-1所示,Route-ID为1.1.1.1的设备要和Route-ID为2.2.2.2的设备建邻居,但是Route-ID为2.2.2.2的设备优先和Route-ID为3.3.3.3的设备建立了邻居,导致Route-ID为1.1.1.1的设备无法收到Route-ID为2.2.2.2的设备发送的Hello报文,邻居状态一直处于INIT状态。
通过隔离广播域,将SR8800-F和华为交换机相连接口分别划分到不同的VLAN,在相应的VLAN接口下分别启动OSPFv3进程,则SR8800-F与华为交换机可以实现P2P类型网络下的OSPFv3协议对接。
如图6-1所示,Router A为路由反射器设备,Router A和Router C建立BGP会话,中间经过Router B。Router A和Router C为SR8800-F设备,Router B为友商设备。在开局时,出现Router A和Router C的BGP邻居反复震荡的情况。
图6-1 设备 BGP邻居震荡故障案例组网图
(1) 观察与Router A相连的其他设备,其他设备邻居建立正常,仅Router A和Router C处于反复重建震荡阶段。
(2) 查看logfile日志,提示BGP会话超过会话保持时间,设备BGP状态由Established变为Idle。之后BGP会话重新建立,BGP状态由Openconfirm变为Established。BGP会话反复断开又重新建立。
%Feb 4 12:24:47:654 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/5/BGP_STATE_CHANGED: BGP default.: 172.25.128.210 state has changed from ESTABLISHED to IDLE for a notification received: Hold Timer Expired/ErrSubCode Unspecified.
%Feb 4 12:24:49:819 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/5/BGP_STATE_CHANGED: BGP default.: 172.25.128.210 State is changed from OPENCONFIRM to ESTABLISHED.
(3) 使用ping命令,在Router A和Router C之间可以Ping通且不丢包。怀疑是Router B丢弃BGP报文导致发生,在 两边Router A和Router C上收集BGP的DEBUG信息。
a. 查看Router A的DEBUG信息,发现Router A既发送Keepalive报文也接收Keepalive报文。
*Feb 17 15:19:14:500 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;
BGP.: 172.25.128.210 Send KEEPALIVE
Length: 19
%Feb 17 15:19:57:037 2022 MPLS-RouterA-B-YueQ-10F-A02-PE SSHS/5/SSHS_ACL_DENY: -MDC=1; The SSH Connection 61.240.202.41(ZJWS_INTERNET) request was denied according to ACL rules.
*Feb 17 15:20:08:829 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;
BGP.: 172.25.128.210 Recv KEEPALIVE
Length: 19
*Feb 17 15:20:10:500 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;
BGP_TIMER.: 172.25.128.210 KA Timer Expired.
*Feb 17 15:20:10:500 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;
BGP.: 172.25.128.210 Send KEEPALIVE
Length: 19
b. 查看Router C的DEBUG信息,发现Router C只发送Keepalive报文不接收Keepalive报文。
Feb 17 15:20:07:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;
BGP.: 172.25.128.174 Send KEEPALIVE
Length: 19
*Feb 17 15:21:01:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;
BGP_TIMER.: 172.25.128.174 KA Timer Expired.
*Feb 17 15:21:01:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;
BGP.: 172.25.128.174 Send KEEPALIVE
Length: 19
*Feb 17 15:21:18:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;
BGP_TIMER.: 172.25.128.174 HD Timer Expired.
*Feb 17 15:21:18:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;
BGP_TIMER.: 172.25.128.174 Restart Timer Created.
*Feb 17 15:21:18:315 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;
BGP_TIMER.: 172.25.128.174 KA Timer Deleted.
*Feb 17 15:21:18:315 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;
BGP_TIMER.: 172.25.128.174 HD Timer Deleted.
%Feb 17 15:21:18:315 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/5/BGP_STATE_CHANGED: -MDC=1;
BGP default.: 172.25.128.174 state has changed from ESTABLISHED to IDLE for hold timer expiration caused by peer device.
(4) 进一步检查现场配置,发现现场修改了接口默认的MTU。
#
interface Route-Aggregation11
description To_SD_E10_ASR9k_BE11
mtu 1586
ip address 172.25.140.202 255.255.255.252
isis enable 100
isis circuit-type p2p
link-aggregation mode dynamic
mpls enable
#
(5) 观察BGP日志每18秒断一次,根据经验怀疑是分片造成的BGP邻居震荡。
(6) 在Router A上对Router C使用ping命令,指定发送不同的ICMP回显请求报文的长度,且不允许对发送的ICMP回显请求报文进行分片。发现请求报文的长度分别为1472、1500、1558和1559字节,1558和1559字节无法Ping通。经检查发现Router B的MTU为1586,超过1586字节的报文会被丢弃。
<RouterA> ping -f -s 1472 172.25.128.174 172.25.128.210
<RouterA> ping -f -s 1500 172.25.128.174 172.25.128.210
<RouterA> ping -f -s 1558 172.25.128.174 172.25.128.210
<RouterA> ping -f -s 1559 172.25.128.174 172.25.128.210
(7) 修改TCP MSS或MTU,将值调小,使得TCP报文分片减小,从而避免Router B丢弃报文。现场的情况建议TCP MSS调整为1400(TCP MSS是协商两端的最小值,一端调整即可)。
BGP会话建立过程中会发送Keepalive报文和Update报文,由于Router A发送的Update报文超过了Router B的MTU导致被Router B丢弃。因此Router C只能收到Keepalive报文而不能收到Update报文,因此TCP报文的序号不连续,导致TCP报文被丢弃,Router C只发送Keepalive报文不接收Keepalive报文。因为Router C发送到Update报文没有超过Router B的MTU,因此Router A既发送Keepalive报文也接收Keepalive报文。
修改本端与对端的TCP MSS或MTU,使得BGP的TCP报文分片小于中间设备的MTU值,从而避免中间设备丢弃报文。
如图7-1所示为典型三级组网,其中Router A和Router B为省级核心PE设备,Switch A为省核心CE设备,Router C和Router D为市级核心设备,Router E和Router F为县级核心设备,Switch A为县级核心CE设备,Switch A与某IP地址为8.8.8.8的站点连接。
Switch B通过主备链路接入县级PE设备:
· 主用链路路为Router A、Router C和Router E。主用链路通过BGP和MPLS L3VPN将路由传递给省核心PE设备Router A,在Router A上BGP VPNv4路由与OSPF路由互相引入,最后Router A通过OSPF将路由传递给Switch A。Router A和Router E具有相同的OSPF域标识符(均为缺省值0)。
· 备用链路为Router B、Router D和Router F,备用链路在Router F上将接入层的静态路由引入到OSPF中,然后Router F通过OSPF将路由传递给Switch A。
组网中存在两个OSPF进程:Router A、Switch A、Router B和Router D上运行的是OSPF 1,Router D和Router F上运行的是OSPF 2。Router D上两个OSPF进程互相引入路由。
此组网的目的是:当链路正常时,流量通过主用链路;当主用链路发生故障时,流量通过备用链路;当主用链路的故障修复后,流量重新走主用链路。目前的问题是当主用链路发生故障后流量会切换到备用链路,但是主用链路的故障修复后流量不会切回到主用链路。
图7-1 BGP及OSPF路由优选导致来回路径不一致组网图
以下显示信息仅为示例,并非设备实际的软、硬件信息。
(1) 已知某站点IP地址为8.8.8.8,对应的VPN实例为1,查看Router A上关于此站点的路由。
<RouterA> display ip routing-table vpn-instance 1 8.8.8.8
Summary count : 1
Destination/Mask Proto Pre Cost NextHop Interface
8.8.8.8/32 BGP 255 2 6.6.6.6 XGE3/1/1
站点的路由8.8.8.8从BGP学习到,下一跳地址是Router C的Loopback地址,优先级为255。
(2) 查看Router A的OSPF 1的链路状态数据库信息,查看IP地址为8.8.8.8对应的站点对应的LSA。
<RouterA> display ospf 1 lsdb
OSPF Process 1 with Router ID 10.0.0.2
Link State Database
Area: 0.0.0.0
Type LinkState ID AdvRouter Age Len Sequence Metric
Router 10.0.0.2 10.0.0.2 669 36 80000003 0
Router 5.5.5.5 5.5.5.5 661 48 80000004 0
Router 1.1.1.1 1.1.1.1 660 60 80000007 0
Network 10.0.0.6 5.5.5.5 660 32 80000002 0
Network 10.0.0.2 10.0.0.2 669 32 80000002 0
Sum-Net 8.8.8.8 10.0.0.2 650 28 80000001 2
AS External Database
Type LinkState ID AdvRouter Age Len Sequence Metric
External 10.0.0.0 5.5.5.5 642 36 80000001 1
External 7.7.7.7 5.5.5.5 642 36 80000001 1
Route distinguisher: 1:6
Total number of routes: 1
Paths: 1 available, 1 best
BGP routing table information of 8.8.8.8/32:
From : 6.6.6.6 (6.6.6.6)
Rely nexthop : 10.0.0.10
Original nexthop: 6.6.6.6
OutLabel : 1279
Ext-Community : <OSPF Domain Id: 0.0.0.0:0>, <OSPF Router Id: 6.6.6.6:0:0>,
<OSPF AreaNum: 0.0.0.0 RouteType: 1 Option: 0>, <RT: 1:1>
RxPathID : 0x0
TxPathID : 0x0
AS-path : (null)
Origin : incomplete
Attribute value : MED 2, localpref 100, pref-val 0
State : valid, internal, best
IP precedence : N/A
QoS local ID : N/A
Traffic index : N/A
IP地址为8.8.8.8对应的站点对应的LSA的“Type”为“Sum-Net”,即这是一条类型为Network Summary LSA(Type-3)的LSA。Router A和Router E具有相同的OSPF域标识符(均为0)。站点8.8.8.8的BGP VPNv4路由中携带的OSPF域标识符为0,Router A将BGP VPNv4路由引入OSPF时,因为Router A的主域标识符与路由中携带的OSPF域标识符相同,此路由作为Network Summary LSA(即Type-3 LSA)发布给Switch A。
在Router B上有两条关于站点8.8.8.8的LSA,一条是OSPF 1中由Router A发布的Type-3 LSA,一条是OSPF 2中由Router F发布的Type-5 LSA。Type-3 LSA的优先级高于Type-5 LSA,因此Router B上两个OSPF进程互相引入路由时,OSPF 1引入的Type-5 LSA未处于激活状态,OSPF 2引入的Type-3 LSA处于激活状态。Router B会将Type-3 LSA发布给备用链路,流量会根据Type-3 LSA转发,即流量通过主用链路。
(3) 在Router A上先中断再恢复BGP邻居,使用display ip routing-table命令显示目的地址为8.8.8.8的VPN实例1的路由信息。
<RouterA> display ip routing-table vpn 1 8.8.8.8
Summary count : 1
Destination/Mask Proto Pre Cost NextHop Interface
8.8.8.8/32 O_ASE2 150 1 10.0.0.1 XGE3/1/1
此时8.8.8.8的路由为OSPF路由而不是BGP路由。此路由为Router D引入的Type-5 LSA,流量通过备用链路转发。
(4) 在Router A上使用display bgp routing-table vpnv4命令显示目的地址为8.8.8.8的BGP VPNv4路由信息。
<RouterA> display bgp routing-table vpnv4
BGP local router ID is 2.2.2.2
Status codes: * - valid, > - best, d - dampened, h - history
s - suppressed, S - stale, i - internal, e - external
a - additional-path
Origin: i - IGP, e - EGP, ? - incomplete
Total number of routes from all PEs: 1
Route distinguisher: 1:2(1)
Total number of routes: 6
Network NextHop MED LocPrf PrefVal Path/Ogn
* > 1.1.1.1/32 10.0.0.1 2 32768 ?
* > 5.5.5.5/32 10.0.0.1 3 32768 ?
* > 7.7.7.7/32 10.0.0.1 2 32768 ?
* >i 8.8.8.8/32 6.6.6.6 2 100 0 ?
* > 10.0.0.0/20 10.0.0.1 2 32768 ?
* > 10.0.0.4/30 10.0.0.1 3 32768 ?
Route distinguisher: 1:6
Total number of routes: 1
Network NextHop MED LocPrf PrefVal Path/Ogn
* >i 8.8.8.8/32 6.6.6.6
可见BGP邻居被成功恢复,但是流量没有从备用链路切换到主用链路上。
(5) 在Router A上配置路由策略,将IP地址为8.8.8.8的路由的优先级设置为130。
a. 定义一条名为p1的IPv4地址前缀列表,只允许8.8.8.8/32的路由通过。
<RouterA> system-view
[RouterA] ip prefix-list p1 permit 8.8.8.8 32
b. 创建一个名为policy1的路由策略,其节点序列号为10,匹配模式为permit。如果匹配已存在的地址前缀列表p1,那么设置该路由协议的优先级为130。
[RouterA] route-policy policy1 permit node 10
[RouterA-route-policy-policy1-10] if-match ip address prefix-list p1
[RouterA-route-policy-policy1-10] apply preference 130
(6) 查看Router A上8.8.8.8站点的路由。
<RouterA> display ip routing-table vpn-instance 1 8.8.8.8
Summary count : 1
Destination/Mask Proto Pre Cost NextHop Interface
8.8.8.8/32 BGP 130 2 6.6.6.6 XGE3/1/1
此时8.8.8.8的路由为恢复为BGP路由,流量通过主用链路转发。
如果通过domain-id命令配置了OSPF域标识符,则PE将OSPF路由引入到BGP时,主域标识符被附加到BGP VPNv4路由上,作为BGP的扩展团体属性传递给对端PE。对端PE接收到BGP路由后,将本地配置的OSPF主域标识符、从域标识符和路由中携带的OSPF域标识符进行比较:如果主域标识符或从域标识符与其相同,且为区域内或区域间路由,则将路由重新引入到OSPF时,该路由作为Network Summary LSA(即Type-3 LSA)发布给CE;否则,该路由将作为AS External LSA(即Type-5 LSA)或NSSA External LSA(即Type-7 LSA)发布给CE。
主用链路正常时,在Router D上有两条关于站点8.8.8.8的LSA,一条是OSPF 1中由Router A发布的Type-3 LSA,一条是OSPF 2中由Router F发布的Type-5 LSA。Type-3 LSA的优先级高于Type-5 LSA,因此Router D上两个OSPF进程互相引入路由时,OSPF 1引入的Type-5 LSA未处于激活状态,OSPF 2引入的Type-3 LSA处于激活状态。Router D会将Type-3 LSA发布给备用链路,而不会将Type-5 LSA发布给主用链路,流量会根据Type-3 LSA转发,即流量通过主用链路。
BGP路由出现异常时,Type-3 LSA取消,Router A学到了Router D引入的Type-5 LSA,流量走备用链路。BGP路由恢复后,因为Type-5 LSA生成的OSPF路由的优先级为150,而BGP路由的缺省优先级为255,OSPF路由的优先级高,BGP路由处于未激活状态。因此流量仍然通过备用链路。
通过路由策略配置站点的BGP路由的优先级,使BGP路由的优先级高于OSPF,这样在BGP路由恢复时流量会自动从备用链路切换到主用链路。
设备接口物理状态UP/DOWN后查看相应的Trap信息有记录,但是没有提示具体的接口编号。
%Nov 21 16:36:10:014 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification linkDown(1.3.6.1.6.3.1.1.5.3) with ifIndex(1.3.6.1.2.1.2.2.1.1.610)=610;ifAdminStatus(1.3.6.1.2.1.2.2.1.7.610)=1;ifOperStatus(1.3.6.1.2.1.2.2.1.8.610)=2.
(1) 查看其它设备的Trap信息,发现在接口物理状态UP/DOWN后相应的Trap信息包含具体的接口,比如下列Trap信息:
%Nov 21 16:15:00:954 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification linkDown(1.3.6.1.6.3.1.1.5.3) with ifIndex(1.3.6.1.2.1.2.2.1.1.592)=592;ifAdminStatus(1.3.6.1.2.1.2.2.1.7.592)=1;ifOperStatus(1.3.6.1.2.1.2.2.1.8.592)=2.
%Nov 21 16:15:00:953 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification hh3cIfPortDown(1.3.6.1.4.1.25506.2.40.3.0.6) with ifIndex(1.3.6.1.2.1.2.2.1.1.592)=592;ifDescr(1.3.6.1.2.1.2.2.1.2.592)=Ten-GigabitEthernet1/6/0/10.
(2) 设备的Trap信息没有具体的接口信息,不利于监控系统及时发现异常。
%Nov 21 16:36:10:014 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification linkDown(1.3.6.1.6.3.1.1.5.3) with ifIndex(1.3.6.1.2.1.2.2.1.1.610)=610;ifAdminStatus(1.3.6.1.2.1.2.2.1.7.610)=1;ifOperStatus(1.3.6.1.2.1.2.2.1.8.610)=2.
缺省情况下,设备发送的linkUp/linkDown告警信息的格式为标准格式,不包含具体的端口信息。
在系统视图下执行snmp-agent trap if-mib link extended命令对标准格式的linkUp或linkDown告警信息进行私有扩展。扩展格式的linkUp/linkDown告警信息由标准格式的linkUp/linkDown告警信息后增加接口描述信息构成,使用扩展格式的告警信息有助于网络管理员快速定位问题。
需要注意的是,使用扩展格式之前要确保NMS支持扩展格式,因配置snmp-agent trap if-mib link extended命令后,设备发送的linkUp/linkDown告警信息为扩展格式的信息。如果NMS不支持扩展格式,可能会无法解析信息否则会导致无法解析信息。
配置SR8800-F与思科N9000进行IS-IS协议对接时,两边设备的配置相同,但IS-IS邻居一直无法建立成功。
(1) 在SR8800-F上执行debugging isis timer命令,打开IS-IS定时器调试信息开关,提示Level1的邻居Hello定时器超时。
<Sysname> debugging isis adj-packet 1
*Mar 2 07:21:40:899 2022 H3C ISIS/7/ISISDBG: -MDC=1;
ISIS-1-TMR: Level-1 hello timer expired on the circuit GigabitEthernet3/1/1.
(2) 在SR8800-F上执行debugging isis adj-packet send命令,打开IS-IS Hello报文发送调试信息开关,发现Hello报文发送正常,发送的Hello报文长度为1541。
<Sysname> debugging isis adj-packet send 1
*Mar 2 07:21:40:919 2022 H3C ISIS/7/ISISDBG: -MDC=1;
ISIS-1-ADJ: Send a Lan L1 Hello packet on circuit(GigabitEthernet3/1/1)
*Mar 2 07:21:40:920 2022 H3C ISIS/7/ISISDBG: -MDC=1;
ISIS-1-ADJ:
0000: 83 1b 01 06 10 01 00 00 02 00 00 00 00 00 59 00
0010: 1e 06 05 40 00 00 00 00 00 59 02 01 02 01 00 84
// 0x605 = 1541,也就是MTU=1541
(3) 在SR8800-F上执行debugging isis adj-packet receive命令,打开IS-IS Hello报文接收调试信息开关,发现Hello报文接收正常,接收的Hello报文长度为1527。
<Sysname> debugging isis adj-packet receive 1
*Mar 2 07:21:40:921 2022 H3C ISIS/7/ISISDBG: -MDC=1;
ISIS-1-ADJ: Receive a Lan L1 Hello packet from(0000.0000.0001) on circuit(GigabitEthernet3/1/1)
*Mar 2 07:21:40:922 2016 H3C ISIS/7/ISISDBG: -MDC=1;
ISIS-1-ADJ: Level-1 NBR(0000.0000.0001) two way pass.
*Mar 2 07:21:40:923 2022 H3C ISIS/7/ISISDBG: -MDC=1;
ISIS-1-ADJ:
0000: 83 1b 01 00 10 01 00 00 02 00 00 00 02 05 30 00
0010: 1e 05 f7 40 00 00 00 02 05 30 3d 81 01 cc d3 03
// 0x5f7 = 1527,也就是MTU=1527
(4) 在N9000上执行show isis interface命令,查看IS-IS配置,发现IS-IS接口MTU为1527。
N9000# show isis interface ten-gigabitethernet 0/0/0/1
Wed Mar 2 17:20:39.287 CST
TenGigE0/0/0/1 Enabled
Adjacency Formation: Enabled
Prefix Advertisement: Enabled
IPv4 BFD: Disabled
IPv6 BFD: Disabled
BFD Min Interval: 150
BFD Multiplier: 3
Circuit Type: level-2-only (Interface circuit type is level-1-2)
Media Type: LAN
Circuit Number: 37
Level-2
Adjacency Count: 1
LAN ID:
Priority (Local/DIS): 64/64
Next LAN IIH in: 226 ms
LSP Pacing Interval: 33 ms
PSNP Entry Queue Size: 0
CLNS I/O
Protocol State: Up
MTU: 1527
...
(5) 在N9000设备上执行show interface命令,查看物理接口MTU配置,发现物理接口实际配置的MTU值为1541。
N9000# show interface ten-gigabitethernet 0/0/0/1
Wed Mar 2 17:20:50.379 CST
TenGigE0/0/0/1 is up, line protocol is up
Interface state transitions: 27
Hardware is TenGigE, address is
Layer 1 Transport Mode is LAN
Description:
Internet address is
MTU 1541 bytes, BW 10000000 Kbit (Max: 10000000 Kbit)
...
(6) 在SR8800-F上执行mtu命令,配置接口GigabitEthernet3/1/1的MTU为1527,成功建立邻接关系。
<Sysname> system-view
[Sysname] interface gigabitethernet 3/1/1
[Sysname-GigabitEthernet3/1/1] mtu 1527
[Sysname-GigabitEthernet3/1/1] quit
我司设备与思科设备使用的MTU算法不一致,我司设备计算IS-IS接口MTU大小时不考虑以太网帧MAC头部长度,IS-IS接口MTU值以接口上配置的MTU值为准;思科设备计算IS-IS接口MTU大小时会考虑以太网帧MAC头部长度,IS-IS接口MTU值以接口上配置的MTU值去掉以太网帧MAC头部长度为准。这样会导致我司设备与思科设备在配置相同时,双方IS-IS接口MTU协商不一致,N9000设备Hello报文接收异常,提示Hello定时器超时。
配置接口MTU时,将SR8800-F接口MTU值配置为思科N9000接口MTU值-14(以太网帧MAC头部长度),则SR8800-F与思科N9000 IS-IS协议对接成功,IS-IS邻居正常建立。
设备上HundredGigE6/0/1以太网接口上可插拔QSFP-100G-ER4L-WDM1300光模块的发送与接收功率处于正常状态,但是接口无法正常通信。
(1) 请在H3C官网“文档中心”获取《H3C SR8800-F路由器 单板与光模块适配关系表》。
(2) 根据《H3C SR8800-F路由器 单板与光模块适配关系表》,检查单板与光模块适配关系。
确认单板可以支持QSFP-100G-ER4L-WDM1300型号的光模块。
(3) 使用display transceiver interface命令检查光模块生产或定制厂商是否为H3C。
# 显示HundredGigE6/0/1接口上插入的可插拔光模块的主要特征参数。
<Sysname> display transceiver interface hundredgige 6/0/1
HundredGigE6/0/1 transceiver information:
Transceiver Type : 100G_BASE_ER4L_QSFP28
Connector Type : LC
Wavelength(nm) : 1300
Transfer Distance(km) : 30(SMF)
Digital Diagnostic Monitoring : YES
Vendor Name : H3C
通过显示信息,可以确认QSFP-100G-ER4L-WDM1300光模块为H3C厂商。
(4) 使用display transceiver diagnosis命令显示可插拔光模块的数字诊断参数的当前测量值。
# 显示HundredGigE6/0/1接口上插入的可插拔光模块的数字诊断参数的当前测量值。
<Sysname> display transceiver diagnosis interface hundredgige 6/0/1
HundredGigE6/0/1 transceiver diagnostic information:
Current diagnostic parameters:
[module] Temp.(°C) Voltage(V)
33 3.35
[channel] Bias(mA) RX power(dBm) TX power(dBm)
1 75.64 -5.79 0.19
2 53.40 -5.83 0.93
3 53.67 -5.78 1.15
4 70.03 -5.40 0.27
Alarm thresholds:
Temp.(°C) Voltage(V) Bias(mA) RX power(dBm) TX power(dBm)
High 75 3.63 110.00 -2.50 6.50
Low -5 2.97 20.00 -21.49 -2.50
通过显示信息,可以确认QSFP-100G-ER4L-WDM1300光模块的数字诊断参数的当前测量值处于正常状态。
(5) 使用display transceiver alarm命令显示可插拔光模块的当前故障告警信息。
# 显示HundredGigE6/0/1接口上插入的可插拔光模块的当前故障告警信息。
<Sysname> display transceiver alarm interface hundredgige 6/0/1
HundredGigE6/0/1 transceiver current alarm information:
RX loss of signal(channel 1)
RX loss of signal(channel 2)
RX loss of signal(channel 3)
RX loss of signal(channel 4)
RX power low(channel 1)
RX power low(channel 2)
RX power low(channel 3)
RX power low(channel 4)
TX bias low(channel 1)
TX bias low(channel 2)
TX bias low(channel 3)
TX bias low(channel 4)
通过显示信息,可以确认QSFP-100G-ER4L-WDM1300可插拔光模块信号丢失。
(6) 将QSFP-100G-ER4L-WDM1300可插拔光模块更换到同一单板上其他接口时,光模块的发送与接收功率仍旧处于正常状态,但是接口仍旧无法正常通信。
(7) 由于本端条件限制,无法在设备上100GE以太网接口开启环回功能。通过在对端友商设备上100GE以太网接口开启外部环回后,在本端我司设备上使用display interface命令显示接口的运行状态和相关信息,确认本端我司设备上100GE以太网接口处于正常状态。
(8) 确认对端友商设备上100GE以太网接口不进行前向纠错(FEC:Forward Error Correction),而本端我司设备上100GE以太网接口进行前向纠错且前向纠错模式为RS-FEC。
由于链路两端前向纠错模式不一致,导致接口无法正常通信。对于接口的前向纠错模式,用户需要保证链路两端使用相同的[前向纠错模式。
在本案例中,为了保证链路两端使用相同的前向纠错模式,使接口正常通信,可在本端我司设备上100GE以太网接口使用如下命令:
· 通过port fec mode auto命令根据光模块类型自动设置FEC模式。
· 通过port fec mode none命令不进行前向纠错。
关于port fec mode命令详细介绍及使用指导,请参见《H3C SR8800-F路由器 命令参考》中以太网接口命令。
用户在现场维护时发现,多台设备都存在主用主控板CPU使用率周期性上升到75%左右的情况,如下所示:
(1) 设备CPU使用率升高时,通过查看进程的统计信息,发现comsh进程CPU占用率较高。
<Sysname>monitor thread dumbtty slot 4 cpu 0
(2) 查看logfile日志,存在SSH用户持续大量的周期性登录的记录。
用户确认存在异常服务器会在短时间内尝试周期性登录到设备,并执行一系列命令。当用户短时间内反复进行登录退出设备操作,并执行很多查看命令时,会创建很多临时进程,从而导致CPU使用率瞬间升高。
排除异常登录服务器问题,产品针对SSH的异常冲击进行CPU优化,防止出现CPU使用率瞬间升高的情况。
两天路由器Router A和Router B建立OSPF邻居,Router A执行了default-route-advertise命令将缺省路由引入到OSPF路由区域,Router B不能学习到Router A发布的缺省路由。
(1) 通过display ospf peer确认两台设备之间的OSPF邻接关系正常建立。
<RouterA> display ospf peer
OSPF Process 1 with Router ID 2.2.2.1
Neighbor Brief Information
Area: 0.0.0.0
Router ID Address Pri Dead-Time State Interface
3.3.3.1 1.1.1.2 1 33 Full/ - XGE3/1/1
<RouterB> display ospf peer
OSPF Process 1 with Router ID 3.3.3.1
Neighbor Brief Information
Area: 0.0.0.0
Router ID Address Pri Dead-Time State Interface
2.2.2.1 1.1.1.1 1 36 Full/ - XGE3/1/1
(2) 查看两端OSPF协议是否配置发布默认路由。
通过display current-configuration configuration ospf命令,发现两端设备OSPF内均有发布默认路由且无路由过滤配置。
<RouterA> display current-configuration configuration ospf
#
ospf 1
default-route-advertise type 2
area 0.0.0.0
network 1.1.1.0 0.0.0.255
<RouterB> display current-configuration configuration ospf
#
ospf 1
default-route-advertise
area 0.0.0.0
network 1.1.1.0 0.0.0.255
(3) 通过display ip routing-table命令查看两台设备的路由表,确认路由学习情况。
Router A的路由表存在静态路由的缺省路由,优先级60。
<RouterA> display ip routing-table
Destinations : 17 Routes : 17
Destination/Mask Proto Pre Cost NextHop Interface
0.0.0.0/0 Static 60 0 2.2.2.2 XGE3/1/1
0.0.0.0/32 Direct 0 0 127.0.0.1 InLoop0
1.1.1.0/24 Direct 0 0 1.1.1.1 XGE3/1/1
1.1.1.0/32 Direct 0 0 1.1.1.1 XGE3/1/1
1.1.1.1/32 Direct 0 0 127.0.0.1 InLoop0
Router B的路由表存在静态路由的缺省路由,优先级200,并没有OSPF发布的优先级为150的缺省路由。
<RouterB> display ip routing-table
Destinations : 17 Routes : 17
Destination/Mask Proto Pre Cost NextHop Interface
0.0.0.0/0 Static 200 0 3.3.3.2 XGE3/1/1
0.0.0.0/32 Direct 0 0 127.0.0.1 InLoop0
1.1.1.0/24 Direct 0 0 1.1.1.2 XGE3/1/1
1.1.1.0/32 Direct 0 0 1.1.1.2 XGE3/1/1
(4) 通过display ospf lsdb命令查看Router B上的OSPF LSDB信息,确认Router A是否有把路由传递出来。
Router B的OSPF LSDB表存在两条缺省路由的LSDB信息,分别为自身产生(3.3.3.1)和Router A发布(2.2.2.1),所以可以确定Router A有发布默认路由给Router B。
<RouterB> display ospf lsdb
OSPF Process 1 with Router ID 3.3.3.1
Link State Database
Area: 0.0.0.0
Type LinkState ID AdvRouter Age Len Sequence Metric
Router 3.3.3.1 3.3.3.1 361 48 80000006 0
Router 2.2.2.1 2.2.2.1 362 48 80000006 0
AS External Database
Type LinkState ID AdvRouter Age Len Sequence Metric
External 0.0.0.0 3.3.3.1 361 36 80000001 1
External 0.0.0.0 2.2.2.1 1444 36 80000003 1
根据协议规定,当路由器产生并发布了一个描述缺省路由的Type-5 LSA时,默认情况下该路由器不再计算来自其他路由器的缺省路由。
在本案例中,Router B上存在本地配置的静态缺省路由,并且在OSPF中同样配置了发布缺省路由,所以Router B本地产生了一条Type-5的缺省路由LSA。因此当Router B收到了Router A发布过来的缺省路由LSA时,即使新的路由优先级150高于本地配置的200,依旧无法替代本地生成的缺省路由。
在Router B上的OSPF视图下配置default-route-advertise并指定permit-calculate-other参数,表示当路由器产生并发布了一个描述缺省路由的Type-5 LSA时,仍然会计算来自于其他路由器的缺省路由。
如图7-1所示,一台Router D路由器与三台路由器Router A、Router B、Router C建立ebgp邻居。Router D从Router A处学到具体路由1.1.1.1/32,从Router B处学到具体路由1.1.1.2/32,本地聚合为1.1.1.0/24后发送给Router C。Router A的具体路由1.1.1.1/32是通过network命令配置BGP发布的本地网段路由;Router B的具体路由1.1.1.2/32是通过import-route命令引入的静态路由。在Router C上通过dampening命令配置了BGP路由衰减。当Router B上的1.1.1.2/32路由发生振荡,理论上Router D上的聚合路由仍能存在,但实际上Router D发送给Router C的聚合路由也发生了振荡。
图13-1 BGP聚合路由属性变化导致路由震荡组网图
以下显示信息仅为示例,并非设备实际的软、硬件信息
(1) 通过display bgp routing-table ipv4 unicast命令查看Router D的BGP具体路由学习情况。
· 查看从Router A处学习的具体路由1.1.1.1/32。
<RouterD> display bgp routing-table ipv4 1.1.1.1 32
BGP local router ID: 20.0.0.2
Local AS number: 200
Paths: 1 available, 1 best
BGP routing table information of 1.1.1.1/32:
From : 10.0.0.1 (1.1.1.1)
Rely nexthop : 10.0.0.1
Original nexthop: 10.0.0.1
OutLabel : NULL
RxPathID : 0x0
TxPathID : 0x0
AS-path : 100
Origin : igp
Attribute value : MED 0, pref-val 0
State : suppressed, valid, external, best
IP precedence : N/A
QoS local ID : N/A
Traffic index : N/A
· 查看从Router B处学习的具体路由1.1.1.2/32。
<RouterD> display bgp routing-table ipv4 1.1.1.2 32
BGP local router ID: 20.0.0.2
Local AS number: 200
Paths: 1 available, 1 best
BGP routing table information of 1.1.1.2/32:
From : 20.0.0.1 (20.0.0.1)
Rely nexthop : 20.0.0.1
Original nexthop: 20.0.0.1
OutLabel : NULL
RxPathID : 0x0
TxPathID : 0x0
AS-path : 100
Origin : incomplete
Attribute value : MED 0, pref-val 0
State : suppressed, valid, external, best
IP precedence : N/A
QoS local ID : N/A
Traffic index : N/A
Router D可以学到的两条具体路由,分别来自于Router A和Router B。通过对比可以发现两条路由的Origin属性不同:
· igp:表示路由产生于本AS内。通过network命令发布路由的路由信息来源为IGP。
· egp:表示路由是通过EGP(Exterior Gateway Protocol,外部网关协议)学到的。
· incomplete:表示路由的来源无法确定。从IGP协议引入路由的路由信息来源为incomplete。
由于具体路由1.1.1.1/32是通过network命令配置BGP发布的本地网段路由,因此Origin属性为“igp”,由于具体路由1.1.1.2/32是通过import-route命令引入的静态路由,因此Origin属性为“incomplete”。
(2) 通过display bgp routing-table ipv4 unicast命令查看未发生路由震荡时Router D的BGP聚合路由。
<RouterD> display bgp routing-table ipv4 1.1.1.0
BGP local router ID: 20.0.0.2
Local AS number: 200
Paths: 1 available, 1 best
BGP routing table information of 1.1.1.0/24:
Original nexthop: 127.0.0.1
OutLabel : NULL
RxPathID : 0x0
TxPathID : 0x0
AS-path : (null)
Origin : incomplete
Attribute value : pref-val 32768
State : valid, local, best
This route is an atomic-aggregated route
Aggregator : AS 200, Aggregator ID: 20.0.0.2
IP precedence : N/A
QoS local ID : N/A
Traffic index : N/A
如果参与聚合的具体路由所包含的Origin属性不同,那么聚合路由按照Incomplete、EGP、IGP的顺序选择Origin属性。因为存在Origin属性为Incomplete和IGP的具体路由,所以聚合路由的Origin属性为Incomplete。
(3) 通过display bgp routing-table ipv4 unicast命令查看发生路由震荡时Router D的BGP聚合路由。
<RouterD> display bgp routing-table ipv4 1.1.1.0
BGP local router ID: 20.0.0.2
Local AS number: 200
Paths: 1 available, 1 best
BGP routing table information of 1.1.1.0/24:
Original nexthop: 127.0.0.1
OutLabel : NULL
RxPathID : 0x0
TxPathID : 0x0
AS-path : (null)
Origin : igp
Attribute value : pref-val 32768
State : valid, local, best
This route is an atomic-aggregated route
Aggregator : AS 200, Aggregator ID: 20.0.0.2
IP precedence : N/A
QoS local ID : N/A
Traffic index : N/A
Router B的主机路由1.1.1.2/32发生震荡,当1.1.1.2/32被撤销时,组成聚合路由的具体路由只有Origin属性为IGP的1.1.1.1/32,因此聚合路由1.1.1.0/24的Origin属性为IGP;当1.1.1.2/32被重新添加时,组成聚合路由的具体路由有Origin属性为IGP的1.1.1.1/32和Origin属性为Incomplete的1.1.1.2/32,因此聚合路由1.1.1.0/24的Origin属性为Incomplete。因此1.1.1.2/32发生的震荡导致了聚合路由1.1.1.0/24的Origin属性发生变化。又因为Router C上通过dampening命令配置了BGP路由衰减,因此聚合路由1.1.1.0/24触发了Router C的路由抑制。
(4) 使聚合路由1.1.1.0/24的Origin属性固定为IGP。
a. 创建一个名为policy1的路由策略,其节点序列号为10,匹配模式为permit,且设置该BGP路由的路由源为IGP。
<RouterD> system-view
[RouterD] route-policy policy1 permit node 10
[RouterD-route-policy-policy1-10] apply origin igp
b. 在BGP IPv4单播地址族视图下,配置在BGP路由表中创建一条聚合路由1.1.1.0/24,且根据路由策略policy1设置聚合路由的属性。
<RouterD> system-view
[RouterD] bgp 200
[RouterD-bgp-default] address-family ipv4 unicast
[RouterD-bgp-default-ipv4] aggregate 1.1.1.0 255.255.255.0 attribute-policy policy1
具体路由发生震荡导致聚合路由Origin属性变化,从而触发路由抑制。
通过路由策略使聚合路由的Origin属性固定不变。
如图14-1所示,设备在VPN网络为PE1和PE2。当使用tracert命令查看CE1到CE2之间VPN业务的路径时,发现回显地址异常,出现不是路径上的地址,但业务流量转发正常。
设备 |
接口 |
IP地址 |
设备 |
接口 |
IP地址 |
CE 1 |
XGE3/1/1 |
30.0.0.2/24 |
P |
Loop0 |
- |
PE 1 |
Loop0 |
8.8.8.8/32 |
|
XGE3/1/1 |
- |
|
XGE3/1/1 |
30.0.0.1/24 |
|
XGE3/1/2 |
- |
|
XGE3/1/2 |
- |
PE 2 |
Loop0 |
- |
CE 2 |
XGE3/1/1 |
20.0.0.2/24 |
|
XGE3/1/1 |
20.0.0.1/24 |
|
|
|
|
XGE3/1/2 |
- |
以下显示信息仅为示例,并非设备实际的软、硬件信息。
(1) 分别在CE1和CE2端使用tracert命令查看业务路径的回显地址是否异常。
# 从CE1 tracert CE2。
[CE1] tracert 20.0.0.2
traceroute to 20.0.0.2 (30.0.0.2), 30 hops at most, 40 bytes each packet, press CTRL+C to break
1 30.0.0.1 (30.0.0.1) 1.000 ms 0.000 ms 1.000 ms
……
11 20.0.0.1 (20.0.0.1) [AS 65002] 1.000 ms 1.000 ms 1.000 ms
12 20.0.0.2 (20.0.0.2) [AS 65002] 2.000 ms 2.000 ms 2.000 ms
回显地址显示正常。第1跳为直连地址,第11跳为CE2的直连地址。
# 从CE2 tracert CE1。
[CE2] tracert 30.0.0.2
traceroute to 30.0.0.2 (30.0.0.2), 30 hops at most, 40 bytes each packet, press CTRL+C to break
1 20.0.0.1 (20.0.0.1) 0.000 ms 1.000 ms 0.000 ms
……
11 8.8.8.8 (8.8.8.8) 2.000 ms 1.000 ms 2.000 ms
12 30.0.0.2 (30.0.0.2) [AS 65001] 2.000 ms 1.000 ms 3.000 ms
回显地址显示异常。第11跳正常情况下应为CE2的直连地址,但是实际显示的地址为8.8.8.8。
业务转发和tracert的最后一跳正常说明路由、接口无异常。
(2) 通过display ip interface brief命令在PE1查看是否存在8.8.8.8的地址。
[PE1] display ip interface brief
*down: administratively down
(s): spoofing (l): loopback
Interface Physical Protocol IP address/Mask VPN instance Description
XGE3/1/1 up up 30.0.0.1/24 v1 --
XGE3/1/2 up up 1.1.1.2/8 -- --
Loop1 up up(s) 2.2.2.2/32 -- --
Loop0 up up(s) 8.8.8.8/32 v1 --
发现8.8.8.8的接口也绑定了VPN。
(3) 使用抓包软件抓包,查看设备的tracert回包地址是否正确。
发现设备回包地址确实为8.8.8.8。
此现象为产品正常处理报文的现象。在VPN网络中,设备在处理tracert报文时,若不是直连下一跳,设备将绑定VPN业务的所有接口中最小的IP地址作为源IP发送ICMP报文,因此导致tracert回显信息与预期不符。
非VPN的流量不存在此问题。
此现象为产品正常处理报文的现象,只是tracert回显的结果差异,不影响实际报文转发。
设备到目的地址有两条等价静态路由,出接口为两个三层聚合接口,分别是Route-Aggregation1与Route-Aggregation2,每个三层聚合口有两个成员端口。对于两个成员端口,出现流量负载不均的情况,例如:一个100GE成员端口流量负载为该接口总带宽的70%,另一个100GE成员端口流量负载基本为空。
以下显示信息仅为示例,其他等价路由出接口为三层聚合接口情况下聚合成员口端负载不均情况,请以设备实际显示为准。
(1) 通过display link-aggregation verbose命令显示已有聚合接口所对应聚合组的详细信息,确认两个成员端口均为选中状态。
<Sysname> display link-aggregation verbose
Loadsharing Type: Shar -- Loadsharing, NonS -- Non-Loadsharing
Port Status: S -- Selected, U -- Unselected, I -- Individual
Port: A -- Auto
Flags: A -- LACP_Activity, B -- LACP_Timeout, C -- Aggregation,
D -- Synchronization, E -- Collecting, F -- Distributing,
G -- Defaulted, H -- Expired
Aggregate Interface: Route-Aggregation1
Aggregation Mode: Static
Loadsharing Type: Shar
Port Status Priority Oper-Key Role
HGE3/1/1 S 32768 8 None
HGE3/1/2 S 32768 8 None
Aggregate Interface: Route-Aggregation2
Aggregation Mode: Static
Loadsharing Type: Shar
Port Status Priority Oper-Key Role
HGE3/1/1 S 32768 8 None
HGE3/1/2 S 32768 8 None
(2) 流量到达设备后,先检查路由表,匹配到两条等价路由。
a. 匹配到两条等价路由后,设备进行第一次哈希算法,对三层聚合接口进行选路,目的是决定将业务流量从哪个三层聚合接口转发出去。选路过程可以大致理解为根据流量报文的五元组等特征,设备计算出一个哈希值,之后将该哈希值对2(等价路由条数)进行取模,模的结果不同,选取的等价路由就不同。
b. 假设此时流量哈希到等价路由1,对应的出接口为三层聚合接口Route-Aggregation1。业务流量在三层聚合接口Route-Aggregation1转发时,需要进行第二次哈希算法,对聚合组接口Route-Aggregation1上的成员端口进行选路,目的是决定将业务流量从聚合组上的哪个成员端口转发出去。该过程与第一次哈希算法的过程类似,设备根据流量特征计算出哈希值,对2(聚合组成员端口数目)取模,模的结果不同,选取的聚合组上成员端口就不同。
由于第一次哈希算法,对三层聚合口进行选路时,已经对流量做了筛选,因此走到Route-Aggregation1的流量,第二次哈希的结果会与第一次哈希的结果基本相同,也就会走到三层聚合接口上一个固定的成员端口进行转发,导致成员端口业务流量负载不均的现象。
基于上述分析,如果等价路由条目数与聚合组上的成员端口数目相同或者互为倍数关系时,则均有可能出现成员端口业务流量负载不均的情况。
等价路由与链路聚合哈希参数一致,并且等价路由条目数与聚合组上的成员端口数目相同或者互为倍数关系时,导致成员端口业务流量负载不均的情况。
· 对于聚合成员端口的情况,可以通过link-aggregation global load-sharing mode或ip load-sharing mode命令调整负载分担方式,使两次哈希过程产生差别,避免成员端口流量负载不均。关于link-aggregation global load-sharing mode或ip load-sharing mode命令详细介绍及使用指导,请参见《H3C SR8800-F路由器 命令参考》中以太网链路聚合或IP转发基础命令。
· 也可以对等价路由条目数或聚合接口进行调整,避免等价路由条目数与聚合组上的成员端口数目相同或者互为倍数关系。例如:在本案例中,可以修改等价路由条目数为2条、聚合组上的成员端口为3个等。
我司设备作为SSH客户端,在通过SSH登录SSH服务端时能正常输入用户名,但会一直处于连接状态中,不能进行下一步输入密码,无法登录到SSH服务端。
以下显示信息仅为示例,并非设备实际的软、硬件信息,请以组网环境中的实际情况为准。
(1) 检查设备和SSH服务端之间的连通性。
通过ping命令检查到SSH服务端12.1.1.1是否可达,能确认Ping结果不丢包,说明设备和SSH服务端之间连通性正常。
[Sysname] ping -a 12.1.1.2 12.1.1.1
Ping 12.1.1.1 (12.1.1.1) from 12.1.1.2: 56 data bytes, press CTRL+C to break
56 bytes from 12.1.1.1: icmp_seq=0 ttl=255 time=0.772 ms
56 bytes from 12.1.1.1: icmp_seq=1 ttl=255 time=0.627 ms
56 bytes from 12.1.1.1: icmp_seq=2 ttl=255 time=0.587 ms
56 bytes from 12.1.1.1: icmp_seq=3 ttl=255 time=0.605 ms
56 bytes from 12.1.1.1: icmp_seq=4 ttl=255 time=0.714 ms
--- Ping statistics for 12.1.1.1 ---
5 packet(s) transmitted, 5 packet(s) received, 0.0% packet loss
round-trip min/avg/max/std-dev = 0.587/0.661/0.772/0.071 ms
(2) 检查SSH服务端的SSH服务是否正常。
更换其它设备作为SSH客户端登录SSH服务端,能正常进行登录,说明SSH服务正常。
(3) 检查SSH服务端是否对于SSH登录的客户端进行了限制。
通过display current-configuration命令查看SSH服务器的配置,结果看到已通过引用ACL对SSH客户端进行了访问控制。
[Sysname]display current-configuration
ssh server acl 2010
#
acl basic 2010
description Manager_IP
rule 5 permit
#
(4) 检查SSH客户端和SSH服务端之间的报文交互是否正常。
在SSH客户端上发起SSH连接请求,然后通过display tcp命令查看TCP连接摘要信息,结果没有看到SSH客户端和SSH服务端之间的TCP连接信息。
[Sysname] display tcp
*: TCP connection with authentication
Local Addr:port Foreign Addr:port State Slot PCB
0.0.0.0:0 0.0.0.0:0 CLOSED 0 0x000000000002b895
0.0.0.0:0 0.0.0.0:0 CLOSED 0 0x000000000002b892
0.0.0.0:0 0.0.0.0:0 CLOSED 0 0x000000000002b88c
0.0.0.0:21 0.0.0.0:0 LISTEN 0 0xffffffffffffffbe
0.0.0.0:22 0.0.0.0:0 LISTEN 0 0xffffffffffffffbd
0.0.0.0:23 0.0.0.0:0 LISTEN 0 0xffffffffffffff9d
0.0.0.0:179 111.1.1.1:0 LISTEN 0 0xffffffffffffffa2
0.0.0.0:179 120.1.1.1:0 LISTEN 0 0xffffffffffffffb0
0.0.0.0:179 123.1.1.1:0 LISTEN 0 0xffffffffffffffa4
0.0.0.0:179 133.1.1.1:0 LISTEN 0 0xffffffffffffffa8
0.0.0.0:11111 0.0.0.0:0 LISTEN 1 0xffffffffffffff9d
0.0.0.0:11111 0.0.0.0:0 LISTEN 2 0xffffffffffffff9d
(5) 检查TCP相关配置是否影响了TCP连接建立。
通过display current-configuration命令查看设备的配置,结果看到设备已配置了攻击防范功能,使得设备丢弃了从对端发送回来的SSH的TCP报文,导致SSH连接失败。
[Sysname]display current-configuration
#
tcp syn-COOKIE enable
tcp anti-naptha enable
tcp anti-syn-flood flow-based enable
tcp anti-syn-flood interface-based enable
#
通过现场配置检查,发现实际作为SSH客户端的设备与SSH服务端配置的攻击防范功能不匹配,导致设备无法正常通过SSH连接登录到SSH服务端。
通过配置undo tcp anti-syn-flood flow-based enable命令关闭基于流的TCP SYN Flood攻击防范功能后,设备作为SSH客户端通过SSH登录SSH服务端,能正常输入用户名和口令成功登录到SSH服务端。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!