• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

H3C SR8800-F路由器 维护宝典-R838x-6W101

03-典型故障案例

本章节下载 03-典型故障案例  (1.04 MB)

03-典型故障案例

目 

1 配置VLAN终结时提示资源不足问题

1.1 问题描述

1.2 处理过程

1.3 根因

1.4 解决方案

2 新老软件版本跨度过大导致软件升级失败

2.1 问题描述

2.2 处理过程

2.2.1 新老软件版本跨度过大时的升级步骤

2.2.2 新老软件版本跨度过大时,升级失败但设备能正常启动的处理步骤

2.2.3 新老软件版本跨度过大时,软件升级失败且设备无法正常启动的处理步骤

2.3 根因

2.4 解决方案

3 部署NQA与静态路由联动未生效

3.1 问题描述

3.2 处理过程

3.3 根因

3.4 解决方案

4 设备主备主控板的软件版本不一致,导致备用主控无法启动

4.1 问题描述

4.2 处理过程

4.3 根因

4.4 解决方案

5 设备与华为交换机P2P类型网络下的OSPFv3协议对接,邻居无法建立

5.1 问题描述

5.2 处理过程

5.3 根因

5.4 解决方案

6 设备BGP邻居震荡故障案例

6.1 问题描述

6.2 处理过程

6.3 根因

6.4 解决方案

7 设备BGP及OSPF路由优选导致来回路径不一致

7.1 问题描述

7.2 处理过程

7.3 根因

7.4 解决方案

8 设备接口物理状态UP/DOWN后查看相应的Trap信息没有具体的接口编号

8.1 问题描述

8.2 处理过程

8.3 根因

8.4 解决方案

9 设备与思科N9000 IS-IS协议对接,双方配置相同,但IS-IS邻居无法建立

9.1 问题描述

9.2 处理过程

9.3 根因

9.4 解决方案

10 设备上100GE以太网接口上可插拔QSFP-100G-ER4L-WDM1300光模块的发送与接收功率处于正常状态,但是接口无法正常通信

10.1 问题描述

10.2 处理过程

10.3 根因

10.4 解决方案

11 设备因频繁登录造成主用主控板CPU使用率高问题

11.1 问题描述

11.2 处理过程

11.3 根因

11.4 解决方案

12 OSPF下发默认路由失败

12.1 问题描述

12.2 处理过程

12.3 根因

12.4 解决方案

13 BGP聚合路由属性变化导致路由震荡

13.1 问题描述

13.2 处理过程

13.3 根因

13.4 解决方案

14 VPN网络中CE设备Tracert回显地址错误

14.1 问题描述

14.2 处理过程

14.3 根因

14.4 解决方案

15 等价路由出接口为三层聚合接口时,成员口端流量负载不均

15.1 问题描述

15.2 处理过程

15.3 根因

15.4 解决方案

16 设备作为SSH客户端无法登录SSH服务端

16.1 问题描述

16.2 处理过程

16.3 根因

16.4 解决方案


1 配置VLAN终结时提示资源不足问题

1.1  问题描述

配置三层聚合子接口的VLAN终结功能时,设备提示资源不足,如下所示:

[Sysname-Route-Aggregation1.1000] vlan-type dot1q vid 1000 to 1500 second-dot1q 3000 to 3300

Not enough resources to complete the operation.

1.2  处理过程

(1)     根据提示信息“Not enough resources to complete the operation”,初步判断命令行无法下发是因系统资源不足导致。

(2)     查看设备上存在的业务板。

<Sysname> display device

Slot No. Brd Type                 Brd Status   Software Version
 0       AAA                      Master       TEMP
 1       NONE                     Absent       NONE
 2       BBB                      Normal       TEMP
 3       NONE                     Absent       NONE
 4       NONE                     Absent       NONE
 5       NONE                     Absent       NONE
 6       CCC                      Normal       TEMP
 7       NONE                     Absent       NONE
 8       NONE                     Absent       NONE
 9       NONE                     Absent       NONE

说明:以上显示信息仅为示例,并非设备实际的软、硬件信息。

(3)     通过咨询技术人员获取2号槽位单板支持的VLAN终结表项规格。

(4)     根据三层以太网子接口/三层聚合子接口VLAN终结占用表项计算方法,每个三层以太网子接口/三层聚合子接口的VLAN终结占用表项数目=三层以太网子接口/三层聚合子接口包含的物理接口数目*外层Tag范围*内层Tag范围。本案例中,三层聚合子接口VLAN终结表项数目=4*(1500-1000)*(3300-3000)=600000(600K),超出2号槽位单板支持的VLAN终结表项规格。

(5)     得出结论:三层聚合子接口上配置的VLAN终结表项数目超出最大规格。

1.3  根因

配置的VLAN终结占用表项数量大于单板支持的最大终结表项规格,因此VLAN终结功能无法配置。

1.4  解决方案

由于该问题属于单板规格类问题,可以通过优化组网,使三层聚合子接口上配置的VLAN终结表项数目在规格范围内。

如果设备有多个三层聚合子接口,那么同一单板上物理接口所属的所有三层聚合子接口VLAN终结表项数目之和不能超过该单板的VLAN终结表项规格。

2 新老软件版本跨度过大导致软件升级失败

2.1  问题描述

在设备上使用boot-loader file命令配置设备下次启动时使用的软件包,当软件包版本与设备当前版本的跨度过大时,重启后可能出现如下问题:

·     设备成功启动且运行正常,但是运行的版本仍为升级前的版本。

·     设备无法正常启动。

2.2  处理过程

说明

以下显示信息仅为示例,请以设备实际的软、硬件信息为准。

 

2.2.1  新老软件版本跨度过大时的升级步骤

新老软件版本跨度过大时,按照如下步骤操作,可以成功升级软件。

(1)     使用FTP、TFTP方式将新软件包下载到任一文件系统的根目录下。(略)

(2)     通过display version命令查看设备当前的BootWare版本。可以看到当前设备的软件版本。

<H3C> display version                                                           

H3C Comware Software, Version 7.1.048, Release 7143                            

Copyright (c) 2004-2014 Hangzhou H3C Tech. Co., Ltd. All rights reserved.      

H3C SR8812-F uptime is 0 weeks, 0 days, 0 hours, 28 minutes                  

Last reboot reason : USER reboot                                               

                                                                                

Boot image: cfa0:/SR8800-CMW710-BOOT-R7143.bin                                 

Boot image version: 7.1.048, Release 7143                                      

  Compiled Nov 18 2014 17:07:41                                                

System image: cfa0:/SR8800-CMW710-SYSTEM-R7143.bin                             

System image version: 7.1.048, Release 7143                                    

  Compiled Nov 18 2014 17:07:41                                                 

                                                                               

                                                                               

MPU(M) 0:                                                                       

Uptime is 0 weeks,0 days,0 hours,28 minutes                                    

BOARD TYPE:         SR07SRPUB1                                                 

DRAM:               4096M bytes                                                 

CFCARD:             4002M bytes                                                

PCB 1 Version:      VER.A                                                      

Bootrom Version:    116                                                        

CPLD 1 Version:     001                                                        

CPLD 2 Version:     001                                                        

Release Version:    H3C SR8812-F-7143                                        

Patch Version  :    None                                                       

Reboot Cause  :     UserReboot                                                 

 Number of Exist Subcards: 0                                                   

                                                                                

                                                                               

LPU 3:                                                                         

Uptime is 0 weeks,0 days,0 hours,26 minutes                                    

BOARD TYPE:         MPE-1104                                                   

DRAM:               2048M bytes                                                

PCB 1 Version:      VER.A                                                      

PCB 2 Version:      VER.A                                                      

Bootrom Version:    124                                                        

CPLD 1 Version:     001                                                         

Release Version:    H3C SR8812-F-7143                                        

Patch Version  :    None                                                       

Reboot Cause  :     UserReboot                                                 

 Number of Exist Subcards: 4                                                   

Subcard 1  :                                                                   

  Exist     : N                                                                

Subcard 2  :                                                                   

  Exist     : Y                                                                

  Type      : MIC-GP8L                                                          

  PCB       : Ver.A                                                            

  Number of Cpld: 1                                                            

  Cpld 0:                                                                       

    SoftWare  : 001                                                            

  Number of Fpga: 0                                                            

Subcard 3  :                                                                    

  Exist     : N                                                                

Subcard 4  :                                                                   

  Exist     : N

(3)     根据表格查找当前BootWare版本支持的IPE包大小的最大值,1.16版本最大支持512M的IPE包。

表2-1 不同BootWare版本支持的IPE包大小的最大值

BootWare版本

描述

1.12及以下

最大支持256M的IPE包

1.13~1.38

最大支持512M的IPE包

1.39~最新

最大支持1G的IPE包

 

(4)     判断新版本软件包的大小是否超过当前BootWare版本支持的上限,选择相应的升级方式。

¡     如果新版本软件包的大小没有超过当前BootWare版本支持的上限,则可直接通过boot-loader file命令配置设备下次启动时使用的软件包

¡     如果如果新版本软件包的大小超过了当前BootWare版本支持的上限,则需先通过可直接通过bootrom update命令加载最新版本的BootWare程序,再通过boot-loader file命令配置设备下次启动时使用的软件包。

(5)     通过bootrom update命令加载BootWare程序。(仅新版本软件包的大小超过当前BootWare版本支持的上限时,需要配置本步骤。)

# 配置bootrom update命令加载BootWare程序。

<Sysname> bootrom update file cfa0:/SR8800-CMW710-BOOT-NEW.bin slot 1

   This command will update the Boot ROM file on the specified board(s), Continue? [Y/N]:y

   Now updating the Boot ROM, please wait...

.............Done.

# 重启设备,完成BootWare程序的加载。

<Sysname> reboot                                                                     

Start to check configuration with next startup configuration file, please wait..

.......DONE!                                                                   

Current configuration may be lost after the reboot, save current configuration?

[Y/N]:y                                                                        

Please input the file name(*.cfg)[cfa0:/config.cfg]                               

(To leave the existing filename unchanged, press the enter key):               

cfa0:/spp.cfg exists, overwrite? [Y/N]:y                                                                              

Validating file. Please wait...                                                 

Saved the current configuration to mainboard device successfully.              

This command will reboot the device. Continue? [Y/N]:y                         

Now rebooting, please wait...

(6)     通过boot-loader file命令配置设备下次启动时使用的软件包。

<Sysname> boot-loader file cfa0:/SR8800.ipe all main                                

Verifying the file cfa0:/SR8800.ipe on slot 0...................................

...........Done.                                                               

H3C SR8812-F images in IPE:                                                    

  SR8800-CMW710-BOOT-NEW.bin                                                 

  SR8800-CMW710-SYSTEM-NEW.bin                                               

This command will set the main startup software images. Continue? [Y/N]:y      

Add images to slot 0.                                                          

File cfa0:/SR8800-CMW710-BOOT-NEW.bin already exists on slot 0.              

Overwrite the existing files? [Y/N]:y                                           

Decompressing file SR8800-CMW710-BOOT-NEW.bin to cfa0:/SR8800-CMW710-BOOT-E830

5.bin..Done.                                           

Decompressing file SR8800-CMW710-SYSTEM-NEW.bin to cfa0:/SR8800-CMW710-SYSTEM-

E8305.bin...Done.                                                

Verifying the file cfa0:/SR8800-CMW710-BOOT-NEW.bin on slot 0.....Done.      

Verifying the file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin on slot 0...............

...........................Done.                                               

The images that have passed all examinations will be used as the main startup so

ftware images at the next reboot on slot 0.                                    

Decompression completed.                                                        

Do you want to delete cfa0:/SR8800.ipe now? [Y/N]:n   

(7)     重启设备,完成软件升级。

<Sysname> reboot                                                                    

Start to check configuration with next startup configuration file, please wait..

.......DONE!                                                                   

Current configuration may be lost after the reboot, save current configuration?

[Y/N]:y                                                                         

Please input the file name(*.cfg)[cfa0:/config.cfg]                               

(To leave the existing filename unchanged, press the enter key):               

cfa0:/spp.cfg exists, overwrite? [Y/N]:y                                                                               

Validating file. Please wait...                                                

Saved the current configuration to mainboard device successfully.              

This command will reboot the device. Continue? [Y/N]:y                          

Now rebooting, please wait...

2.2.2  新老软件版本跨度过大时,升级失败但设备能正常启动的处理步骤

当软件包版本与设备当前版本的跨度过大时,没有预先通过bootrom update命令加载BootWare程序,加载版本且重启后设备正常启动但是设备版本仍为加载前的版本,处理方式如下:

(1)     使用FTP、TFTP方式将新软件包下载到任一文件系统的根目录下。(略)

(2)     通过bootrom update命令加载BootWare程序。

<Sysname> bootrom update file cfa0:/SR8800-CMW710-BOOT-NEW.bin slot 1

   This command will update the Boot ROM file on the specified board(s), Continue? [Y/N]:y

   Now updating the Boot ROM, please wait...

.............Done.

(3)     重启设备,完成BootWare程序的加载。

<Sysname> reboot                                                                    

Start to check configuration with next startup configuration file, please wait..

.......DONE!                                                                   

Current configuration may be lost after the reboot, save current configuration?

[Y/N]:y                                                                        

Please input the file name(*.cfg)[cfa0:/config.cfg]                               

(To leave the existing filename unchanged, press the enter key):               

cfa0:/spp.cfg exists, overwrite? [Y/N]:y                                                                              

Validating file. Please wait...                                                 

Saved the current configuration to mainboard device successfully.              

This command will reboot the device. Continue? [Y/N]:y                         

Now rebooting, please wait...

(4)     通过boot-loader file命令配置设备下次启动时使用的软件包。

<Sysname> boot-loader file cfa0:/SR8800.ipe all main                                

Verifying the file cfa0:/SR8800.ipe on slot 0...................................

...........Done.                                                               

H3C SR8812-F images in IPE:                                                    

  SR8800-CMW710-BOOT-NEW.bin                                                 

  SR8800-CMW710-SYSTEM-NEW.bin                                               

This command will set the main startup software images. Continue? [Y/N]:y      

Add images to slot 0.                                                          

File cfa0:/SR8800-CMW710-BOOT-NEW.bin already exists on slot 0.              

Overwrite the existing files? [Y/N]:y                                           

Decompressing file SR8800-CMW710-BOOT-NEW.bin to cfa0:/SR8800-CMW710-BOOT-E830

5.bin..Done.                                           

Decompressing file SR8800-CMW710-SYSTEM-NEW.bin to cfa0:/SR8800-CMW710-SYSTEM-

E8305.bin...Done.                                                

Verifying the file cfa0:/SR8800-CMW710-BOOT-NEW.bin on slot 0.....Done.      

Verifying the file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin on slot 0...............

...........................Done.                                               

The images that have passed all examinations will be used as the main startup so

ftware images at the next reboot on slot 0.                                    

Decompression completed.                                                       

Do you want to delete cfa0:/SR8800.ipe now? [Y/N]:n   

(5)     重启设备,完成软件升级。

<Sysname> reboot                                                                    

Start to check configuration with next startup configuration file, please wait..

.......DONE!                                                                   

Current configuration may be lost after the reboot, save current configuration?

[Y/N]:y                                                                         

Please input the file name(*.cfg)[cfa0:/config.cfg]                               

(To leave the existing filename unchanged, press the enter key):               

cfa0:/spp.cfg exists, overwrite? [Y/N]:y                                                                               

Validating file. Please wait...                                                

Saved the current configuration to mainboard device successfully.              

This command will reboot the device. Continue? [Y/N]:y                         

Now rebooting, please wait...

2.2.3  新老软件版本跨度过大时,软件升级失败且设备无法正常启动的处理步骤

当软件包版本与设备当前版本的跨度过大时,没有预先通过bootrom update命令加载BootWare程序,加载版本且重启后设备无法正常启动,处理方式如下:

(1)     通过console口登录设备,在设备启动的过程中输入输入<Ctrl+B>进入BOOTWARE界面。然后输入7,选择BootWare选项菜单。

==========================<EXTENDED-BOOTWARE MENU>==========================   

|<1> Boot System                                                           |   

|<2> Enter Serial SubMenu                                                  |   

|<3> Enter Ethernet SubMenu                                                |   

|<4> File Control                                                          |   

|<5> Restore to Factory Default Configuration                              |   

|<6> Skip Current System Configuration                                     |   

|<7> BootWare Operation Menu                                               |   

|<8> Skip Authentication for Console Login                                 |   

|<9> Storage Device Operation                                              |   

|<0> Reboot                                                                |   

============================================================================   

                                                                                

                                                                               

Ctrl+C: Display Copyright                                                      

Ctrl+F: Format File System                                                      

Enter your choice(0-9): 7

(2)     输入4,选择通过以太网的方式升级BootWare。

=========================<BootWare Operation Menu>==========================   

|Note:the operating device is cfa0                                         |   

|<1> Backup Full BootWare                                                  |   

|<2> Restore Full BootWare                                                 |   

|<3> Update BootWare By Serial                                             |   

|<4> Update BootWare By Ethernet                                           |   

|<0> Exit To Main Menu                                                     |   

============================================================================   

Enter your choice(0-4): 4

(3)     输入4,选择修改以太网参数。

===================<BOOTWARE OPERATION ETHERNET SUB-MENU>===================   

|<1> Update Full BootWare                                                  |   

|<2> Update Extended BootWare                                              |   

|<3> Update Basic BootWare                                                 |   

|<4> Modify Ethernet Parameter                                             |   

|<0> Exit To Main Menu                                                     |   

============================================================================   

Enter your choice(0-4):   4

 

==========================<ETHERNET PARAMETER SET>==========================   

|Note:       '.' = Clear field.                                            |   

|            '-' = Go to previous field.                                   |   

|         Ctrl+D = Quit.                                                   |   

============================================================================    

Protocol (FTP or TFTP) :tftp                                                    

Load File Name         :SR8800.ipe                                             

                       :SR8800-CMW710-BOOT-NEW.bin                                                        

Target File Name       :SR8800.ipe                                             

                       :SR8800-CMW710-BOOT-NEW.bin                                                       

Server IP Address      :192.168.2.26                                            

Local IP Address       :192.168.2.88                                           

Subnet Mask            :255.255.255.0                                          

Gateway IP Address     :0.0.0.0                                                 

(4)     输入1,上传BootWare软件。

===================<BOOTWARE OPERATION ETHERNET SUB-MENU>===================   

|<1> Update Full BootWare                                                  |   

|<2> Update Extended BootWare                                              |   

|<3> Update Basic BootWare                                                 |   

|<4> Modify Ethernet Parameter                                             |   

|<0> Exit To Main Menu                                                     |   

============================================================================   

Enter your choice(0-4): 1                                                      

Loading.....................................................................   

.............................................................Done.             

41560064 bytes downloaded!                                                     

Updating Basic BootWare? [Y/N]Y                                                

Updating Basic BootWare.........Done.                                          

Updating Extended BootWare? [Y/N]Y                                             

Updating Extended BootWare.........Done.     

(5)     重启设备,完成BootWare程序的加载。

===================<BOOTWARE OPERATION ETHERNET SUB-MENU>===================   

|<1> Update Full BootWare                                                  |   

|<2> Update Extended BootWare                                              |   

|<3> Update Basic BootWare                                                 |   

|<4> Modify Ethernet Parameter                                             |   

|<0> Exit To Main Menu                                                     |   

============================================================================   

Enter your choice(0-4): 0 

 

=========================<BootWare Operation Menu>==========================   

|Note:the operating device is cfa0                                         |   

|<1> Backup Full BootWare                                                  |   

|<2> Restore Full BootWare                                                 |   

|<3> Update BootWare By Serial                                             |   

|<4> Update BootWare By Ethernet                                           |   

|<0> Exit To Main Menu                                                     |   

============================================================================   

Enter your choice(0-4): 0 

 

==========================<EXTENDED-BOOTWARE MENU>==========================   

|<1> Boot System                                                           |   

|<2> Enter Serial SubMenu                                                  |   

|<3> Enter Ethernet SubMenu                                                |   

|<4> File Control                                                          |   

|<5> Restore to Factory Default Configuration                              |   

|<6> Skip Current System Configuration                                     |   

|<7> BootWare Operation Menu                                               |   

|<8> Skip Authentication for Console Login                                 |   

|<9> Storage Device Operation                                              |   

|<0> Reboot                                                                |   

============================================================================   

                                                                               

                                                                               

Ctrl+C: Display Copyright                                                       

Ctrl+F: Format File System                                                     

Enter your choice(0-9): 0

(6)     在设备完成重启后,输入3,进入以太网子菜单。

==========================<EXTENDED-BOOTWARE MENU>==========================   

|<1> Boot System                                                           |   

|<2> Enter Serial SubMenu                                                  |   

|<3> Enter Ethernet SubMenu                                                |   

|<4> File Control                                                          |   

|<5> Restore to Factory Default Configuration                              |   

|<6> Skip Current System Configuration                                     |   

|<7> BootWare Operation Menu                                               |   

|<8> Skip Authentication for Console Login                                 |   

|<9> Storage Device Operation                                              |   

|<0> Reboot                                                                |   

============================================================================   

Ctrl+Z: Access EXTENDED ASSISTANT MENU                                         

Ctrl+C: Display Copyright                                                      

Ctrl+F: Format File System                                                     

Enter your choice(0-9): 3

(7)     输入5,选择修改以太网参数。

==========================<Enter Ethernet SubMenu>==========================   

|Note:the operating device is cfa0                                         |   

|<1> Download Image Program To SDRAM And Run                               |   

|<2> Update Main Image File                                                |   

|<3> Update Backup Image File                                              |   

|<4> Download Files(*.*)                                                   |   

|<5> Modify Ethernet Parameter                                             |    

|<0> Exit To Main Menu                                                     |   

|<Ensure The Parameter Be Modified Before Downloading!>                    |   

============================================================================   

Enter your choice(0-5): 5  

 

==========================<ETHERNET PARAMETER SET>==========================   

|Note:       '.' = Clear field.                                            |   

|            '-' = Go to previous field.                                   |   

|         Ctrl+D = Quit.                                                   |   

============================================================================   

Protocol (FTP or TFTP) :tftp                                                   

Load File Name         :SR8800-CMW710-BOOT-NEW.bin                           

                       :SR8800.ipe                                             

Target File Name       :SR8800-CMW710-BOOT-NEW.bin                           

                       :SR8800.ipe                                             

Server IP Address      :192.168.2.26                                           

Local IP Address       :192.168.2.88                                           

Subnet Mask            :255.255.255.0                                          

Gateway IP Address     :0.0.0.0 

(8)     输入2,配置设备下次启动时使用的主用软件包。

==========================<Enter Ethernet SubMenu>==========================   

|Note:the operating device is cfa0                                         |   

|<1> Download Image Program To SDRAM And Run                               |   

|<2> Update Main Image File                                                |   

|<3> Update Backup Image File                                              |   

|<4> Download Files(*.*)                                                   |   

|<5> Modify Ethernet Parameter                                             |   

|<0> Exit To Main Menu                                                     |   

|<Ensure The Parameter Be Modified Before Downloading!>                    |   

============================================================================   

Enter your choice(0-5): 2                                                       

Loading.....................................................................Done.                    

644700160 bytes downloaded!                          

The file is exist,will you overwrite it? [Y/N]Y                                

Image file SR8800-CMW710-BOOT-NEW.bin is self-decompressing...               

Saving file cfa0:/SR8800-CMW710-BOOT-NEW.bin ........Done.                   

Image file SR8800-CMW710-SYSTEM-NEW.bin is self-decompressing...             

Saving file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin ........Done. 

(9)     先后输入0和1,直接加载新软件,设备开始启动,启动后完成升级。

==========================<Enter Ethernet SubMenu>==========================   

|Note:the operating device is cfa0                                         |   

|<1> Download Image Program To SDRAM And Run                               |   

|<2> Update Main Image File                                                |   

|<3> Update Backup Image File                                              |   

|<4> Download Files(*.*)                                                   |   

|<5> Modify Ethernet Parameter                                             |   

|<0> Exit To Main Menu                                                     |   

|<Ensure The Parameter Be Modified Before Downloading!>                    |   

============================================================================   

Enter your choice(0-5): 0    

 

==========================<EXTENDED-BOOTWARE MENU>==========================   

|<1> Boot System                                                           |   

|<2> Enter Serial SubMenu                                                  |   

|<3> Enter Ethernet SubMenu                                                |    

|<4> File Control                                                          |   

|<5> Restore to Factory Default Configuration                              |   

|<6> Skip Current System Configuration                                     |   

|<7> BootWare Operation Menu                                               |   

|<8> Skip Authentication for Console Login                                 |   

|<9> Storage Device Operation                                              |   

|<0> Reboot                                                                |   

============================================================================   

Ctrl+Z: Access EXTENDED ASSISTANT MENU                                         

Ctrl+C: Display Copyright                                                       

Ctrl+F: Format File System                                                     

Enter your choice(0-9): 1                                                      

Loading the main image files...                                                 

Loading file cfa0:/SR8800-CMW710-SYSTEM-NEW.bin.............Done.                                          

Loading file cfa0:/SR8800-CMW710-BOOT-NEW.bin...........Done.                

                                                                                

Image file cfa0:/SR8800-CMW710-BOOT-NEW.bin is self-decompressing......Done.                                  

System image is starting...                                                    

                                                                                

Line con0 is available.                                                        

                                                                               

                                                                               

Press ENTER to get started.                                                    

****************************************************************************** 

* Copyright (c) 2004-2021 New H3C Technologies Co., Ltd. All rights reserved.* 

* Without the owner's prior written consent,                                 * 

* no decompiling or reverse-engineering shall be allowed.                    * 

****************************************************************************** 

                                                                               

<Sysname>               

2.3  根因

老版本的Bootware程序支持的IPE包的规格较小,新版本的IPE包的大小超过了老版本的Bootware程序的规格。

2.4  解决方案

新老软件版本跨度过大时,由于Bootware程序的版本与用户需要加载的IPE包的版本不兼容会导致升级失败,可以通过加载新版本的Bootware程序来解决。如果升级失败后设备无法正常启动,可以通过console口登录设备,在设备启动的过程进入BOOTWARE界面来恢复设备。

3 部署NQA与静态路由联动未生效

3.1  问题描述

配置NQA track与静态路由联动时,Track状态切换正常,但是联动静态路由无法失效,导致路由无法正常切换。

3.2  处理过程

(1)     查看设备的Track状态,发现Track状态已经切换至Negative状态,切换正常。

<Sysname> display track 2

Track ID: 2

  State: Negative

  Duration: 0 days 0 hours 1 minutes 18 seconds

  Tracked object type: NQA

  Notification delay: Positive 0, Negative 0 (in seconds)

  Tracked object

    NQA entry: admin admin2

    Reaction: 2

    Remote IP/URL: 192.168.1.5

    Local IP: 183.207.34.81

    Interface: --

(2)     查看设备的路由信息,联动的静态路由未失效,即静态路由与Track联动未生效。

<Sysname> display ip routing-table vpn-instance JiaSu2

 

Destinations : 21     Routes : 21

 

Destination/Mask   Proto   Pre Cost        NextHop         Interface

0.0.0.0/0          Static  60  0           183.207.34.82   XGE3/1/5

0.0.0.0/32         Direct  0   0           127.0.0.1       InLoop0

……

3.3  根因

(1)     首先查看设备静态路由配置,发现设备有3条Track联动静态路由的配置,而根据用户反馈只有Track 2不生效,通过查看静态路由配置未发现异常。

<Sysname> display current-configuration | include route-static

 ip route-static vpn-instance JiaSu1 0.0.0.0 0 183.207.34.98 preference 65 description Jiasu1-bei

 ip route-static vpn-instance JiaSu1 0.0.0.0 0 183.207.34.74 description JiaSu1-zhu track 1

 ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.106 preference 65 description JiaSu2-bei

 ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 preference 30 description JiaSu2-zhu track 2

 ip route-static vpn-instance JiaSu3 0.0.0.0 0 183.207.34.90 description JiaSu3-zhu track 3

 ip route-static vpn-instance JiaSu3 0.0.0.0 0 183.207.34.114 preference 65 description Jiasu3-be

(2)     进一步分析Track的状态,发现Track状态改变了一分钟多,但是没通知到对应的模块。

<Sysname> display track 2

Track ID: 2

  State: Negative

  Duration: 0 days 0 hours 1 minutes 18 seconds

  Tracked object type: NQA

  Notification delay: Positive 0, Negative 0 (in seconds)

  Tracked object

    NQA entry: admin admin2

    Reaction: 2

    Remote IP/URL: 192.168.1.5

    Local IP: 183.207.34.81

    Interface: --

(3)     在设备上实际配置,输入配置的时候发现问题:先配置description,后配置track,这种配置实际上JiaSu2-zhu track 2整个内容都属于description的描述内容,非真正关联了Track,从而导致未生效。即并非仅Track 2不生效,实际上是三个Track都不生效。

<Sysname> system-view

[Sysname] ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 description JiaSu2-zhu track 2 ?

  TEXT  Route description (up to 150 characters)

  <cr>

3.4  解决方案

正确配置是先配置track,后配置description,修改成下面的配置后功能正常。

ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 track 2 description JiaSu2-zhu

ip route-static vpn-instance JiaSu2 0.0.0.0 0 183.207.34.82 track 2 preference 30 description JiaSu2-zhu

ip route-static vpn-instance JiaSu3 0.0.0.0 0 183.207.34.90 track 3 description JiaSu3-zhu

4 设备主备主控板的软件版本不一致,导致备用主控无法启动

4.1  问题描述

设备上先后插入两块主控板,先插入的主用主控板正常启动,后插入的备用主控板状态一直处于Fault状态。

4.2  处理过程

(1)     检查设备供电功率。

检查设备的供电功率是否充足,如不足,请提高设备的供电功率。

(2)     单独启动备用主控板。

拔出主用主控板,单独使用备用主控板重新启动设备,发现设备能正常启动,并且单板状态正常。

(3)     检查主控板的软件版本。

查看步骤(2)中备用主控版本启动的软件版本,发现与主用主控板的软件版本不一致。说明主用主控版本的软件版本未同步到备用主控板上。

4.3  根因

主备主控板的启动软件版本不一致,且软件版本差异较大,导致备用主控板的软件版本无法同步,启动失败。

对于软件版本跨度较小的主备主控板,备用主控板可直接从主用主控板同步软件版本。

4.4  解决方案

单独更新备用主控板的软件版本,将软件版本更新成与主用主控板的一致。

5 设备与华为交换机P2P类型网络下的OSPFv3协议对接,邻居无法建立

5.1  问题描述

配置SR8800-F与华为交换机进行P2P类型网络下的OSPFv3协议对接时,邻居建立不起来,邻居状态一直处于INIT状态。组网环境如图5-1所示。

图5-1 OSPFv3协议对接组网图

 

5.2  处理过程

(1)     在Router-ID为1.1.1.1的设备上执行display ospfv3 peer命令,查看设备的邻居,发现与其建立邻居的设备是Router-ID为2.2.2.2的设备,但邻居状态一直处于INIT状态。

<Sysname> display ospfv3 peer

 OSPFv3 Process 1 with Router ID 1.1.1.1

 

 Area: 0.0.0.0

-------------------------------------------------------------------------

 Router ID       Pri State             Dead-Time InstID Interface

 2.2.2.2         1   Init/ -           00:00:32  0      Vlan16

(2)     在Router-ID为2.2.2.2的设备上执行display ospfv3 peer命令,查看设备的邻居,发现邻居是Router-ID为3.3.3.3的设备,且邻居状态处于Full状态。

<Sysname> display ospfv3 peer

 OSPFv3 Process 1 with Router ID 2.2.2.2

 

 Area: 0.0.0.0

-------------------------------------------------------------------------

 Router ID       Pri State             Dead-Time InstID Interface

 3.3.3.3         1   Full/ -           00:00:32  0      Vlan16

(3)     在Router-ID为2.2.2.2的设备上进行报文抓包,发现设备可以接收到其他三台设备发送的Hello报文。在其他三台设备上抓包,发现只有Router-ID为3.3.3.3的设备会收到来自Router-ID为2.2.2.2的设备的Hello报文。因为这个原因导致Router-ID为1.1.1.1的设备与Router-ID为2.2.2.2的设备无法建立起邻居关系。

(4)     通过配置SR8800-F和华为交换机互连的接口与华为交换机之间互连的接口分别属于不同VLAN后,相互之间可以建立OSPFv3邻居,问题解决。

5.3  根因

华为交换机互连的二层接口以及与SR8800-F互连的二层接口都属于VLAN 16,故所有设备都处于一个广播域中。当所有设备处于一个广播域时,由于配置的是OSPFv3网络类型为P2P,导致OSPFv3邻居的建立与Hello报文接收的先后顺序强相关。

图5-1所示,Route-ID为1.1.1.1的设备要和Route-ID为2.2.2.2的设备建邻居,但是Route-ID为2.2.2.2的设备优先和Route-ID为3.3.3.3的设备建立了邻居,导致Route-ID为1.1.1.1的设备无法收到Route-ID为2.2.2.2的设备发送的Hello报文,邻居状态一直处于INIT状态。

5.4  解决方案

通过隔离广播域,将SR8800-F和华为交换机相连接口分别划分到不同的VLAN,在相应的VLAN接口下分别启动OSPFv3进程,则SR8800-F与华为交换机可以实现P2P类型网络下的OSPFv3协议对接。

6 设备BGP邻居震荡故障案例

6.1  问题描述

图6-1所示,Router A为路由反射器设备,Router A和Router C建立BGP会话,中间经过Router B。Router A和Router C为SR8800-F设备,Router B为友商设备。在开局时,出现Router A和Router C的BGP邻居反复震荡的情况。

图6-1 设备 BGP邻居震荡故障案例组网图

6.2  处理过程

(1)     观察与Router A相连的其他设备,其他设备邻居建立正常,仅Router A和Router C处于反复重建震荡阶段。

(2)     查看logfile日志,提示BGP会话超过会话保持时间,设备BGP状态由Established变为Idle。之后BGP会话重新建立,BGP状态由Openconfirm变为Established。BGP会话反复断开又重新建立。

%Feb  4 12:24:47:654 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/5/BGP_STATE_CHANGED: BGP default.: 172.25.128.210 state has changed from ESTABLISHED to IDLE for a notification received: Hold Timer Expired/ErrSubCode Unspecified.

%Feb  4 12:24:49:819 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/5/BGP_STATE_CHANGED: BGP default.: 172.25.128.210 State is changed from OPENCONFIRM to ESTABLISHED.

(3)     使用ping命令,在Router A和Router C之间可以Ping通且不丢包。怀疑是Router B丢弃BGP报文导致发生,在 两边Router A和Router C上收集BGP的DEBUG信息。

a.     查看Router A的DEBUG信息,发现Router A既发送Keepalive报文也接收Keepalive报文。

*Feb 17 15:19:14:500 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;

        BGP.: 172.25.128.210 Send KEEPALIVE

        Length: 19

 %Feb 17 15:19:57:037 2022 MPLS-RouterA-B-YueQ-10F-A02-PE SSHS/5/SSHS_ACL_DENY: -MDC=1; The SSH Connection 61.240.202.41(ZJWS_INTERNET) request was denied according to ACL rules.

*Feb 17 15:20:08:829 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;

        BGP.: 172.25.128.210 Recv KEEPALIVE

        Length: 19

*Feb 17 15:20:10:500 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;

 BGP_TIMER.: 172.25.128.210 KA Timer Expired.

*Feb 17 15:20:10:500 2022 MPLS-RouterA-B-YueQ-10F-A02-PE BGP/7/DEBUG: -MDC=1;

        BGP.: 172.25.128.210 Send KEEPALIVE

        Length: 19

b.     查看Router C的DEBUG信息,发现Router C只发送Keepalive报文不接收Keepalive报文。

Feb 17 15:20:07:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;

        BGP.: 172.25.128.174 Send KEEPALIVE

        Length: 19

 *Feb 17 15:21:01:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;

 BGP_TIMER.: 172.25.128.174 KA Timer Expired.

*Feb 17 15:21:01:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;

        BGP.: 172.25.128.174 Send KEEPALIVE

        Length: 19

*Feb 17 15:21:18:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;

 BGP_TIMER.: 172.25.128.174 HD Timer Expired.

*Feb 17 15:21:18:314 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;

 BGP_TIMER.: 172.25.128.174 Restart Timer Created.

*Feb 17 15:21:18:315 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;

 BGP_TIMER.: 172.25.128.174 KA Timer Deleted.

*Feb 17 15:21:18:315 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/7/DEBUG: -MDC=1;

 BGP_TIMER.: 172.25.128.174 HD Timer Deleted.

%Feb 17 15:21:18:315 2022 MPLS-RouterC-B-SD-1F-1-E10-RR BGP/5/BGP_STATE_CHANGED: -MDC=1;

 BGP default.: 172.25.128.174 state has changed from ESTABLISHED to IDLE for hold timer expiration caused by peer device.

(4)     进一步检查现场配置,发现现场修改了接口默认的MTU。

#

interface Route-Aggregation11

description To_SD_E10_ASR9k_BE11

mtu 1586

ip address 172.25.140.202 255.255.255.252

isis enable 100

isis circuit-type p2p

link-aggregation mode dynamic

mpls enable

#

(5)     观察BGP日志每18秒断一次,根据经验怀疑是分片造成的BGP邻居震荡。

(6)     在Router A上对Router C使用ping命令,指定发送不同的ICMP回显请求报文的长度,且不允许对发送的ICMP回显请求报文进行分片。发现请求报文的长度分别为1472、1500、1558和1559字节,1558和1559字节无法Ping通。经检查发现Router B的MTU为1586,超过1586字节的报文会被丢弃。

<RouterA> ping -f -s 1472 172.25.128.174 172.25.128.210

<RouterA> ping -f -s 1500 172.25.128.174 172.25.128.210

<RouterA> ping -f -s 1558 172.25.128.174 172.25.128.210  

<RouterA> ping -f -s 1559 172.25.128.174 172.25.128.210

(7)     修改TCP MSS或MTU,将值调小,使得TCP报文分片减小,从而避免Router B丢弃报文。现场的情况建议TCP MSS调整为1400(TCP MSS是协商两端的最小值,一端调整即可)。

6.3  根因

BGP会话建立过程中会发送Keepalive报文和Update报文,由于Router A发送的Update报文超过了Router B的MTU导致被Router B丢弃。因此Router C只能收到Keepalive报文而不能收到Update报文,因此TCP报文的序号不连续,导致TCP报文被丢弃,Router C只发送Keepalive报文不接收Keepalive报文。因为Router C发送到Update报文没有超过Router B的MTU,因此Router A既发送Keepalive报文也接收Keepalive报文。

6.4  解决方案

修改本端与对端的TCP MSS或MTU,使得BGP的TCP报文分片小于中间设备的MTU值,从而避免中间设备丢弃报文。

7 设备BGP及OSPF路由优选导致来回路径不一致

7.1  问题描述

7-1所示为典型三级组网,其中Router ARouter B为省级核心PE设备,Switch A为省核心CE设备,Router CRouter D为市级核心设备,Router ERouter F为县级核心设备,Switch A为县级核心CE设备,Switch AIP地址为8.8.8.8的站点连接。

Switch B通过主备链路接入县级PE设备:

·     主用链路路为Router A、Router C和Router E。主用链路通过BGP和MPLS L3VPN将路由传递给省核心PE设备Router A,在Router A上BGP VPNv4路由与OSPF路由互相引入,最后Router A通过OSPF将路由传递给Switch A。Router A和Router E具有相同的OSPF域标识符(均为缺省值0)。

·     备用链路为Router B、Router D和Router F,备用链路在Router F上将接入层的静态路由引入到OSPF中,然后Router F通过OSPF将路由传递给Switch A。

组网中存在两个OSPF进程:Router A、Switch A、Router B和Router D上运行的是OSPF 1,Router D和Router F上运行的是OSPF 2。Router D上两个OSPF进程互相引入路由。

此组网的目的是:当链路正常时,流量通过主用链路;当主用链路发生故障时,流量通过备用链路;当主用链路的故障修复后,流量重新走主用链路。目前的问题是当主用链路发生故障后流量会切换到备用链路,但是主用链路的故障修复后流量不会切回到主用链路。

图7-1 BGP及OSPF路由优选导致来回路径不一致组网图

 

7.2  处理过程

说明

以下显示信息仅为示例,并非设备实际的软、硬件信息。

 

(1)     已知某站点IP地址为8.8.8.8,对应的VPN实例为1,查看Router A上关于此站点的路由。

<RouterA> display ip routing-table vpn-instance 1 8.8.8.8

Summary count : 1

Destination/Mask   Proto   Pre Cost        NextHop         Interface

8.8.8.8/32         BGP     255 2           6.6.6.6         XGE3/1/1

站点的路由8.8.8.8从BGP学习到,下一跳地址是Router C的Loopback地址,优先级为255。

(2)     查看Router A的OSPF 1的链路状态数据库信息,查看IP地址为8.8.8.8对应的站点对应的LSA。

<RouterA> display ospf 1 lsdb

              OSPF Process 1 with Router ID 10.0.0.2

                 Link State Database

 

                         Area: 0.0.0.0

 Type      LinkState ID    AdvRouter       Age  Len   Sequence  Metric

 Router    10.0.0.2        10.0.0.2        669  36    80000003  0  

 Router    5.5.5.5         5.5.5.5         661  48    80000004  0  

 Router    1.1.1.1         1.1.1.1         660  60    80000007  0  

 Network   10.0.0.6        5.5.5.5         660  32    80000002  0  

 Network   10.0.0.2        10.0.0.2        669  32    80000002  0  

 Sum-Net   8.8.8.8         10.0.0.2        650  28    80000001  2  

 

                 AS External Database

 Type      LinkState ID    AdvRouter       Age  Len   Sequence  Metric

 External  10.0.0.0        5.5.5.5         642  36    80000001  1  

 External  7.7.7.7         5.5.5.5         642  36    80000001  1  

 

Route distinguisher: 1:6

 Total number of routes: 1

 Paths:   1 available, 1 best

 

 BGP routing table information of 8.8.8.8/32:

 From            : 6.6.6.6 (6.6.6.6)

 Rely nexthop    : 10.0.0.10

 Original nexthop: 6.6.6.6

 OutLabel        : 1279

 Ext-Community   : <OSPF Domain Id: 0.0.0.0:0>, <OSPF Router Id: 6.6.6.6:0:0>,

                   <OSPF AreaNum: 0.0.0.0 RouteType: 1 Option: 0>, <RT: 1:1>

 RxPathID        : 0x0 

 TxPathID        : 0x0 

 AS-path         : (null)

 Origin          : incomplete

 Attribute value : MED 2, localpref 100, pref-val 0

 State           : valid, internal, best

 IP precedence   : N/A

 QoS local ID    : N/A

 Traffic index   : N/A

IP地址为8.8.8.8对应的站点对应的LSA的“Type”为“Sum-Net”,即这是一条类型为Network Summary LSA(Type-3)的LSA。Router A和Router E具有相同的OSPF域标识符(均为0)。站点8.8.8.8的BGP VPNv4路由中携带的OSPF域标识符为0,Router A将BGP VPNv4路由引入OSPF时,因为Router A的主域标识符与路由中携带的OSPF域标识符相同,此路由作为Network Summary LSA(即Type-3 LSA)发布给Switch A。

在Router B上有两条关于站点8.8.8.8的LSA,一条是OSPF 1中由Router A发布的Type-3 LSA,一条是OSPF 2中由Router F发布的Type-5 LSA。Type-3 LSA的优先级高于Type-5 LSA,因此Router B上两个OSPF进程互相引入路由时,OSPF 1引入的Type-5 LSA未处于激活状态,OSPF 2引入的Type-3 LSA处于激活状态。Router B会将Type-3 LSA发布给备用链路,流量会根据Type-3 LSA转发,即流量通过主用链路。

(3)     在Router A上先中断再恢复BGP邻居,使用display ip routing-table命令显示目的地址为8.8.8.8的VPN实例1的路由信息。

<RouterA> display ip routing-table vpn 1 8.8.8.8

 

Summary count : 1

 

Destination/Mask   Proto   Pre Cost        NextHop         Interface

8.8.8.8/32         O_ASE2  150 1           10.0.0.1        XGE3/1/1

此时8.8.8.8的路由为OSPF路由而不是BGP路由。此路由为Router D引入的Type-5 LSA,流量通过备用链路转发。

(4)     在Router A上使用display bgp routing-table vpnv4命令显示目的地址为8.8.8.8的BGP VPNv4路由信息

<RouterA> display bgp routing-table vpnv4

 

 BGP local router ID is 2.2.2.2

 Status codes: * - valid, > - best, d - dampened, h - history

               s - suppressed, S - stale, i - internal, e - external

               a - additional-path

       Origin: i - IGP, e - EGP, ? - incomplete

 

 Total number of routes from all PEs: 1

 

 Route distinguisher: 1:2(1)

 Total number of routes: 6

 

     Network            NextHop         MED        LocPrf     PrefVal Path/Ogn

 

* >  1.1.1.1/32         10.0.0.1        2                     32768   ?

* >  5.5.5.5/32         10.0.0.1        3                     32768   ?

* >  7.7.7.7/32         10.0.0.1        2                     32768   ?

* >i 8.8.8.8/32         6.6.6.6         2          100        0       ?

* >  10.0.0.0/20        10.0.0.1        2                     32768   ?

* >  10.0.0.4/30        10.0.0.1        3                     32768   ?

 

 Route distinguisher: 1:6

 Total number of routes: 1

              

     Network            NextHop         MED        LocPrf     PrefVal Path/Ogn

 

* >i 8.8.8.8/32         6.6.6.6    

可见BGP邻居被成功恢复,但是流量没有从备用链路切换到主用链路上。

(5)     在Router A上配置路由策略,将IP地址为8.8.8.8的路由的优先级设置为130。

a.     定义一条名为p1的IPv4地址前缀列表,只允许8.8.8.8/32的路由通过。

<RouterA> system-view

[RouterA] ip prefix-list p1 permit 8.8.8.8 32

b.     创建一个名为policy1的路由策略,其节点序列号为10,匹配模式为permit。如果匹配已存在的地址前缀列表p1,那么设置该路由协议的优先级为130。

[RouterA] route-policy policy1 permit node 10

[RouterA-route-policy-policy1-10] if-match ip address prefix-list p1

[RouterA-route-policy-policy1-10] apply preference 130

(6)     查看Router A上8.8.8.8站点的路由。

<RouterA> display ip routing-table vpn-instance 1 8.8.8.8

Summary count : 1

Destination/Mask   Proto   Pre Cost        NextHop         Interface

8.8.8.8/32         BGP     130 2           6.6.6.6         XGE3/1/1

此时8.8.8.8的路由为恢复为BGP路由,流量通过主用链路转发。

7.3  根因

如果通过domain-id命令配置了OSPF域标识符,则PE将OSPF路由引入到BGP时,主域标识符被附加到BGP VPNv4路由上,作为BGP的扩展团体属性传递给对端PE。对端PE接收到BGP路由后,将本地配置的OSPF主域标识符、从域标识符和路由中携带的OSPF域标识符进行比较:如果主域标识符或从域标识符与其相同,且为区域内或区域间路由,则将路由重新引入到OSPF时,该路由作为Network Summary LSA(即Type-3 LSA)发布给CE;否则,该路由将作为AS External LSA(即Type-5 LSA)或NSSA External LSA(即Type-7 LSA)发布给CE。

主用链路正常时,在Router D上有两条关于站点8.8.8.8的LSA,一条是OSPF 1中由Router A发布的Type-3 LSA,一条是OSPF 2中由Router F发布的Type-5 LSA。Type-3 LSA的优先级高于Type-5 LSA,因此Router D上两个OSPF进程互相引入路由时,OSPF 1引入的Type-5 LSA未处于激活状态,OSPF 2引入的Type-3 LSA处于激活状态。Router D会将Type-3 LSA发布给备用链路,而不会将Type-5 LSA发布给主用链路,流量会根据Type-3 LSA转发,即流量通过主用链路。

BGP路由出现异常时,Type-3 LSA取消,Router A学到了Router D引入的Type-5 LSA,流量走备用链路。BGP路由恢复后,因为Type-5 LSA生成的OSPF路由的优先级为150,而BGP路由的缺省优先级为255,OSPF路由的优先级高,BGP路由处于未激活状态。因此流量仍然通过备用链路。

7.4  解决方案

通过路由策略配置站点的BGP路由的优先级,使BGP路由的优先级高于OSPF,这样在BGP路由恢复时流量会自动从备用链路切换到主用链路。

8 设备接口物理状态UP/DOWN后查看相应的Trap信息没有具体的接口编号

8.1  问题描述

设备接口物理状态UP/DOWN后查看相应的Trap信息有记录,但是没有提示具体的接口编号。

%Nov 21 16:36:10:014 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification linkDown(1.3.6.1.6.3.1.1.5.3) with ifIndex(1.3.6.1.2.1.2.2.1.1.610)=610;ifAdminStatus(1.3.6.1.2.1.2.2.1.7.610)=1;ifOperStatus(1.3.6.1.2.1.2.2.1.8.610)=2.

8.2  处理过程

(1)     查看其它设备的Trap信息,发现在接口物理状态UP/DOWN后相应的Trap信息包含具体的接口,比如下列Trap信息:

%Nov 21 16:15:00:954 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification linkDown(1.3.6.1.6.3.1.1.5.3) with ifIndex(1.3.6.1.2.1.2.2.1.1.592)=592;ifAdminStatus(1.3.6.1.2.1.2.2.1.7.592)=1;ifOperStatus(1.3.6.1.2.1.2.2.1.8.592)=2.

%Nov 21 16:15:00:953 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification hh3cIfPortDown(1.3.6.1.4.1.25506.2.40.3.0.6) with ifIndex(1.3.6.1.2.1.2.2.1.1.592)=592;ifDescr(1.3.6.1.2.1.2.2.1.2.592)=Ten-GigabitEthernet1/6/0/10.

(2)     设备的Trap信息没有具体的接口信息,不利于监控系统及时发现异常。

%Nov 21 16:36:10:014 2017 Sysname SNMP/6/SNMP_NOTIFY: Notification linkDown(1.3.6.1.6.3.1.1.5.3) with ifIndex(1.3.6.1.2.1.2.2.1.1.610)=610;ifAdminStatus(1.3.6.1.2.1.2.2.1.7.610)=1;ifOperStatus(1.3.6.1.2.1.2.2.1.8.610)=2.

8.3  根因

缺省情况下,设备发送的linkUp/linkDown告警信息的格式为标准格式,不包含具体的端口信息。

8.4  解决方案

在系统视图下执行snmp-agent trap if-mib link extended命令对标准格式的linkUp或linkDown告警信息进行私有扩展。扩展格式的linkUp/linkDown告警信息由标准格式的linkUp/linkDown告警信息后增加接口描述信息构成,使用扩展格式的告警信息有助于网络管理员快速定位问题。

需要注意的是,使用扩展格式之前要确保NMS支持扩展格式,因配置snmp-agent trap if-mib link extended命令后,设备发送的linkUp/linkDown告警信息为扩展格式的信息。如果NMS不支持扩展格式,可能会无法解析信息否则会导致无法解析信息。

9 设备与思科N9000 IS-IS协议对接,双方配置相同,但IS-IS邻居无法建立

9.1  问题描述

配置SR8800-F与思科N9000进行IS-IS协议对接时,两边设备的配置相同,但IS-IS邻居一直无法建立成功。

9.2  处理过程

(1)     在SR8800-F上执行debugging isis timer命令,打开IS-IS定时器调试信息开关,提示Level1的邻居Hello定时器超时。

<Sysname> debugging isis adj-packet 1

*Mar  2 07:21:40:899 2022 H3C ISIS/7/ISISDBG: -MDC=1;

ISIS-1-TMR: Level-1 hello timer expired on the circuit GigabitEthernet3/1/1.

(2)     在SR8800-F上执行debugging isis adj-packet send命令,打开IS-IS Hello报文发送调试信息开关,发现Hello报文发送正常,发送的Hello报文长度为1541。

<Sysname> debugging isis adj-packet send 1

*Mar  2 07:21:40:919 2022 H3C ISIS/7/ISISDBG: -MDC=1;

ISIS-1-ADJ: Send a Lan L1 Hello packet on circuit(GigabitEthernet3/1/1)

*Mar  2 07:21:40:920 2022 H3C ISIS/7/ISISDBG: -MDC=1;

ISIS-1-ADJ:

0000: 83 1b 01 06  10 01 00 00  02 00 00 00  00 00 59 00

0010: 1e 06 05 40  00 00 00 00  00 59 02 01  02 01 00 84

// 0x605 = 1541,也就是MTU=1541

(3)     在SR8800-F上执行debugging isis adj-packet receive命令,打开IS-IS Hello报文接收调试信息开关,发现Hello报文接收正常,接收的Hello报文长度为1527。

<Sysname> debugging isis adj-packet receive 1

*Mar  2 07:21:40:921 2022 H3C ISIS/7/ISISDBG: -MDC=1;

ISIS-1-ADJ: Receive a Lan L1 Hello packet from(0000.0000.0001) on circuit(GigabitEthernet3/1/1)

*Mar  2 07:21:40:922 2016 H3C ISIS/7/ISISDBG: -MDC=1;

ISIS-1-ADJ: Level-1 NBR(0000.0000.0001) two way pass.

*Mar  2 07:21:40:923 2022 H3C ISIS/7/ISISDBG: -MDC=1;

ISIS-1-ADJ:

0000: 83 1b 01 00  10 01 00 00  02 00 00 00  02 05 30 00

0010: 1e 05 f7 40  00 00 00 02  05 30 3d 81  01 cc d3 03

// 0x5f7 = 1527也就是MTU=1527

(4)     在N9000上执行show isis interface命令,查看IS-IS配置,发现IS-IS接口MTU为1527。

N9000# show isis interface ten-gigabitethernet 0/0/0/1

Wed Mar  2 17:20:39.287 CST

 

TenGigE0/0/0/1              Enabled

  Adjacency Formation:      Enabled

  Prefix Advertisement:     Enabled

  IPv4 BFD:                 Disabled

  IPv6 BFD:                 Disabled

  BFD Min Interval:         150

  BFD Multiplier:           3

  Circuit Type:             level-2-only (Interface circuit type is level-1-2)

  Media Type:               LAN

  Circuit Number:           37

  Level-2                   

  Adjacency Count:        1

  LAN ID:               

  Priority (Local/DIS):   64/64

  Next LAN IIH in:        226 ms

  LSP Pacing Interval:    33 ms

  PSNP Entry Queue Size:  0

  CLNS I/O

  Protocol State:         Up

  MTU:                    1527

...

(5)     在N9000设备上执行show interface命令,查看物理接口MTU配置,发现物理接口实际配置的MTU值为1541。

N9000# show interface ten-gigabitethernet 0/0/0/1

Wed Mar  2 17:20:50.379 CST

TenGigE0/0/0/1 is up, line protocol is up

  Interface state transitions: 27

  Hardware is TenGigE, address is

  Layer 1 Transport Mode is LAN

  Description:

  Internet address is

  MTU 1541 bytes, BW 10000000 Kbit (Max: 10000000 Kbit)

...

(6)     在SR8800-F上执行mtu命令,配置接口GigabitEthernet3/1/1的MTU为1527,成功建立邻接关系。

<Sysname> system-view

[Sysname] interface gigabitethernet 3/1/1

[Sysname-GigabitEthernet3/1/1] mtu 1527

[Sysname-GigabitEthernet3/1/1] quit

9.3  根因

我司设备与思科设备使用的MTU算法不一致,我司设备计算IS-IS接口MTU大小时不考虑以太网帧MAC头部长度,IS-IS接口MTU值以接口上配置的MTU值为准;思科设备计算IS-IS接口MTU大小时会考虑以太网帧MAC头部长度,IS-IS接口MTU值以接口上配置的MTU值去掉以太网帧MAC头部长度为准。这样会导致我司设备与思科设备在配置相同时,双方IS-IS接口MTU协商不一致,N9000设备Hello报文接收异常,提示Hello定时器超时。

9.4  解决方案

配置接口MTU时,将SR8800-F接口MTU值配置为思科N9000接口MTU值-14(以太网帧MAC头部长度),则SR8800-F与思科N9000 IS-IS协议对接成功,IS-IS邻居正常建立。

10 设备上100GE以太网接口上可插拔QSFP-100G-ER4L-WDM1300光模块的发送与接收功率处于正常状态,但是接口无法正常通信

10.1  问题描述

设备上HundredGigE6/0/1以太网接口上可插拔QSFP-100G-ER4L-WDM1300光模块的发送与接收功率处于正常状态,但是接口无法正常通信。

10.2  处理过程

(1)     请在H3C官网“文档中心”获取《H3C SR8800-F路由器 单板与光模块适配关系表》。

(2)     根据《H3C SR8800-F路由器 单板与光模块适配关系表》,检查单板与光模块适配关系。

确认单板可以支持QSFP-100G-ER4L-WDM1300型号的光模块。

(3)     使用display transceiver interface命令检查光模块生产或定制厂商是否为H3C。

# 显示HundredGigE6/0/1接口上插入的可插拔光模块的主要特征参数。

<Sysname> display transceiver interface hundredgige 6/0/1

HundredGigE6/0/1 transceiver information:

  Transceiver Type              : 100G_BASE_ER4L_QSFP28

  Connector Type                : LC

  Wavelength(nm)                : 1300

  Transfer Distance(km)         : 30(SMF)

  Digital Diagnostic Monitoring : YES

  Vendor Name                   : H3C

通过显示信息,可以确认QSFP-100G-ER4L-WDM1300光模块为H3C厂商。

(4)     使用display transceiver diagnosis命令显示可插拔光模块的数字诊断参数的当前测量值。

# 显示HundredGigE6/0/1接口上插入的可插拔光模块的数字诊断参数的当前测量值。

<Sysname> display transceiver diagnosis interface hundredgige 6/0/1

HundredGigE6/0/1 transceiver diagnostic information:

  Current diagnostic parameters:

[module]  Temp.(°C)  Voltage(V)

          33         3.35

[channel] Bias(mA)  RX power(dBm)  TX power(dBm)

    1     75.64     -5.79          0.19

    2     53.40     -5.83          0.93

    3     53.67     -5.78          1.15

    4     70.03     -5.40          0.27

  Alarm thresholds:

          Temp.(°C)  Voltage(V)  Bias(mA)  RX power(dBm)  TX power(dBm)

    High  75         3.63        110.00    -2.50          6.50

    Low   -5         2.97        20.00     -21.49         -2.50

通过显示信息,可以确认QSFP-100G-ER4L-WDM1300光模块的数字诊断参数的当前测量值处于正常状态。

(5)     使用display transceiver alarm命令显示可插拔光模块的当前故障告警信息。

# 显示HundredGigE6/0/1接口上插入的可插拔光模块的当前故障告警信息。

<Sysname> display transceiver alarm interface hundredgige 6/0/1

HundredGigE6/0/1 transceiver current alarm information:

  RX loss of signal(channel 1)

  RX loss of signal(channel 2)

  RX loss of signal(channel 3)

  RX loss of signal(channel 4)

  RX power low(channel 1)

  RX power low(channel 2)

  RX power low(channel 3)

  RX power low(channel 4)

  TX bias low(channel 1)

  TX bias low(channel 2)

  TX bias low(channel 3)

  TX bias low(channel 4)

通过显示信息,可以确认QSFP-100G-ER4L-WDM1300可插拔光模块信号丢失。

(6)     将QSFP-100G-ER4L-WDM1300可插拔光模块更换到同一单板上其他接口时,光模块的发送与接收功率仍旧处于正常状态,但是接口仍旧无法正常通信。

(7)     由于本端条件限制,无法在设备上100GE以太网接口开启环回功能。通过在对端友商设备上100GE以太网接口开启外部环回后,在本端我司设备上使用display interface命令显示接口的运行状态和相关信息,确认本端我司设备上100GE以太网接口处于正常状态。

(8)     确认对端友商设备上100GE以太网接口不进行前向纠错(FEC:Forward Error Correction),而本端我司设备上100GE以太网接口进行前向纠错且前向纠错模式为RS-FEC。

10.3  根因

由于链路两端前向纠错模式不一致,导致接口无法正常通信。对于接口的前向纠错模式,用户需要保证链路两端使用相同的[前向纠错模式。

10.4  解决方案

在本案例中,为了保证链路两端使用相同的前向纠错模式,使接口正常通信,可在本端我司设备上100GE以太网接口使用如下命令:

·     通过port fec mode auto命令根据光模块类型自动设置FEC模式。

·     通过port fec mode none命令不进行前向纠错。

关于port fec mode命令详细介绍及使用指导,请参见《H3C SR8800-F路由器 命令参考》中以太网接口命令。

11 设备因频繁登录造成主用主控板CPU使用率高问题

11.1  问题描述

用户在现场维护时发现,多台设备都存在主用主控板CPU使用率周期性上升到75%左右的情况,如下所示:

 

11.2  处理过程

(1)     设备CPU使用率升高时,通过查看进程的统计信息,发现comsh进程CPU占用率较高。

<Sysname>monitor thread dumbtty slot 4 cpu 0

 

(2)     查看logfile日志,存在SSH用户持续大量的周期性登录的记录。

 

11.3  根因

用户确认存在异常服务器会在短时间内尝试周期性登录到设备,并执行一系列命令。当用户短时间内反复进行登录退出设备操作,并执行很多查看命令时,会创建很多临时进程,从而导致CPU使用率瞬间升高。

11.4  解决方案

排除异常登录服务器问题,产品针对SSH的异常冲击进行CPU优化,防止出现CPU使用率瞬间升高的情况。

12 OSPF下发默认路由失败

12.1  问题描述

两天路由器Router A和Router B建立OSPF邻居,Router A执行了default-route-advertise命令将缺省路由引入到OSPF路由区域,Router B不能学习到Router A发布的缺省路由。

12.2  处理过程

(1)     通过display ospf peer确认两台设备之间的OSPF邻接关系正常建立。

<RouterA> display ospf peer

 

         OSPF Process 1 with Router ID 2.2.2.1

               Neighbor Brief Information

 

 Area: 0.0.0.0

 Router ID       Address         Pri Dead-Time  State             Interface

 3.3.3.1         1.1.1.2         1   33         Full/ -           XGE3/1/1

<RouterB> display ospf peer

 

         OSPF Process 1 with Router ID 3.3.3.1

               Neighbor Brief Information

 

 Area: 0.0.0.0

 Router ID       Address         Pri Dead-Time  State             Interface

 2.2.2.1         1.1.1.1         1   36         Full/ -           XGE3/1/1

(2)     查看两端OSPF协议是否配置发布默认路由。

通过display current-configuration configuration ospf命令,发现两端设备OSPF内均有发布默认路由且无路由过滤配置。

<RouterA> display current-configuration configuration ospf

#

ospf 1

 default-route-advertise type 2

 area 0.0.0.0

  network 1.1.1.0 0.0.0.255

 

<RouterB> display current-configuration configuration ospf

#

ospf 1

 default-route-advertise

 area 0.0.0.0

  network 1.1.1.0 0.0.0.255

(3)     通过display ip routing-table命令查看两台设备的路由表,确认路由学习情况。

Router A的路由表存在静态路由的缺省路由,优先级60。

<RouterA> display ip routing-table

 

Destinations : 17       Routes : 17

 

Destination/Mask   Proto   Pre Cost        NextHop         Interface

0.0.0.0/0          Static  60  0           2.2.2.2         XGE3/1/1

0.0.0.0/32         Direct  0   0           127.0.0.1       InLoop0

1.1.1.0/24         Direct  0   0           1.1.1.1         XGE3/1/1

1.1.1.0/32         Direct  0   0           1.1.1.1         XGE3/1/1

1.1.1.1/32         Direct  0   0           127.0.0.1       InLoop0

Router B的路由表存在静态路由的缺省路由,优先级200,并没有OSPF发布的优先级为150的缺省路由。

<RouterB> display ip routing-table

 

Destinations : 17       Routes : 17

 

Destination/Mask   Proto   Pre Cost        NextHop         Interface

0.0.0.0/0          Static  200 0           3.3.3.2         XGE3/1/1

0.0.0.0/32         Direct  0   0           127.0.0.1       InLoop0

1.1.1.0/24         Direct  0   0           1.1.1.2         XGE3/1/1

1.1.1.0/32         Direct  0   0           1.1.1.2         XGE3/1/1

(4)     通过display ospf lsdb命令查看Router B上的OSPF LSDB信息,确认Router A是否有把路由传递出来。

Router B的OSPF LSDB表存在两条缺省路由的LSDB信息,分别为自身产生(3.3.3.1)和Router A发布(2.2.2.1),所以可以确定Router A有发布默认路由给Router B。

<RouterB> display ospf lsdb

 

         OSPF Process 1 with Router ID 3.3.3.1

                 Link State Database

 

                         Area: 0.0.0.0

 Type      LinkState ID    AdvRouter       Age  Len   Sequence  Metric

 Router    3.3.3.1         3.3.3.1         361  48    80000006  0

 Router    2.2.2.1         2.2.2.1         362  48    80000006  0

 

                 AS External Database

 Type      LinkState ID    AdvRouter       Age  Len   Sequence  Metric

 External  0.0.0.0         3.3.3.1         361  36    80000001  1

 External  0.0.0.0         2.2.2.1         1444 36    80000003  1

12.3  根因

根据协议规定,当路由器产生并发布了一个描述缺省路由的Type-5 LSA时,默认情况下该路由器不再计算来自其他路由器的缺省路由。

在本案例中,Router B上存在本地配置的静态缺省路由,并且在OSPF中同样配置了发布缺省路由,所以Router B本地产生了一条Type-5的缺省路由LSA。因此当Router B收到了Router A发布过来的缺省路由LSA时,即使新的路由优先级150高于本地配置的200,依旧无法替代本地生成的缺省路由。

12.4  解决方案

在Router B上的OSPF视图下配置default-route-advertise并指定permit-calculate-other参数,表示当路由器产生并发布了一个描述缺省路由的Type-5 LSA时,仍然会计算来自于其他路由器的缺省路由。

13 BGP聚合路由属性变化导致路由震荡

13.1  问题描述

图7-1所示,一台Router D路由器与三台路由器Router A、Router B、Router C建立ebgp邻居。Router D从Router A处学到具体路由1.1.1.1/32,从Router B处学到具体路由1.1.1.2/32,本地聚合为1.1.1.0/24后发送给Router C。Router A的具体路由1.1.1.1/32是通过network命令配置BGP发布的本地网段路由;Router B的具体路由1.1.1.2/32是通过import-route命令引入的静态路由。在Router C上通过dampening命令配置了BGP路由衰减。当Router B上的1.1.1.2/32路由发生振荡,理论上Router D上的聚合路由仍能存在,但实际上Router D发送给Router C的聚合路由也发生了振荡。

图13-1 BGP聚合路由属性变化导致路由震荡组网图

 

13.2  处理过程

说明

以下显示信息仅为示例,并非设备实际的软、硬件信息

 

(1)     通过display bgp routing-table ipv4 unicast命令查看Router D的BGP具体路由学习情况。

·     查看从Router A处学习的具体路由1.1.1.1/32。

<RouterD> display bgp routing-table ipv4 1.1.1.1 32      

BGP local router ID: 20.0.0.2

Local AS number: 200

Paths:   1 available, 1 best

BGP routing table information of 1.1.1.1/32:

From            : 10.0.0.1 (1.1.1.1)

Rely nexthop    : 10.0.0.1

Original nexthop: 10.0.0.1

OutLabel        : NULL

RxPathID        : 0x0

TxPathID        : 0x0

AS-path         : 100

Origin          : igp

Attribute value : MED 0, pref-val 0

State           : suppressed, valid, external, best

IP precedence   : N/A

QoS local ID    : N/A

Traffic index   : N/A

·     查看从Router B处学习的具体路由1.1.1.2/32。

<RouterD> display bgp routing-table ipv4 1.1.1.2 32

BGP local router ID: 20.0.0.2

Local AS number: 200

Paths:   1 available, 1 best

BGP routing table information of 1.1.1.2/32:

From            : 20.0.0.1 (20.0.0.1)

Rely nexthop    : 20.0.0.1

Original nexthop: 20.0.0.1

OutLabel        : NULL

RxPathID        : 0x0

TxPathID        : 0x0

AS-path         : 100

Origin          : incomplete

Attribute value : MED 0, pref-val 0

State           : suppressed, valid, external, best

IP precedence   : N/A

QoS local ID    : N/A

Traffic index   : N/A

Router D可以学到的两条具体路由,分别来自于Router A和Router B。通过对比可以发现两条路由的Origin属性不同:

·     igp:表示路由产生于本AS内。通过network命令发布路由的路由信息来源为IGP。

·     egp:表示路由是通过EGP(Exterior Gateway Protocol,外部网关协议)学到的。

·     incomplete:表示路由的来源无法确定。从IGP协议引入路由的路由信息来源为incomplete。

由于具体路由1.1.1.1/32是通过network命令配置BGP发布的本地网段路由,因此Origin属性为“igp”,由于具体路由1.1.1.2/32是通过import-route命令引入的静态路由,因此Origin属性为“incomplete”。

(2)     通过display bgp routing-table ipv4 unicast命令查看未发生路由震荡时Router D的BGP聚合路由。

<RouterD> display bgp routing-table ipv4 1.1.1.0

BGP local router ID: 20.0.0.2

Local AS number: 200

Paths:   1 available, 1 best

BGP routing table information of 1.1.1.0/24:

Original nexthop: 127.0.0.1

OutLabel        : NULL

RxPathID        : 0x0

TxPathID        : 0x0

AS-path         : (null)

Origin          : incomplete

Attribute value : pref-val 32768

State           : valid, local, best

This route is an atomic-aggregated route

Aggregator      : AS 200, Aggregator ID: 20.0.0.2

IP precedence   : N/A

QoS local ID    : N/A

Traffic index   : N/A

如果参与聚合的具体路由所包含的Origin属性不同,那么聚合路由按照Incomplete、EGP、IGP的顺序选择Origin属性。因为存在Origin属性为Incomplete和IGP的具体路由,所以聚合路由的Origin属性为Incomplete。

(3)     通过display bgp routing-table ipv4 unicast命令查看发生路由震荡时Router D的BGP聚合路由。

<RouterD> display bgp routing-table ipv4 1.1.1.0

BGP local router ID: 20.0.0.2

Local AS number: 200

Paths:   1 available, 1 best

BGP routing table information of 1.1.1.0/24:

Original nexthop: 127.0.0.1

OutLabel        : NULL

RxPathID        : 0x0

TxPathID        : 0x0

AS-path         : (null)

Origin          : igp

Attribute value : pref-val 32768

State           : valid, local, best

This route is an atomic-aggregated route

Aggregator      : AS 200, Aggregator ID: 20.0.0.2

IP precedence   : N/A

QoS local ID    : N/A

Traffic index   : N/A

Router B的主机路由1.1.1.2/32发生震荡,当1.1.1.2/32被撤销时,组成聚合路由的具体路由只有Origin属性为IGP的1.1.1.1/32,因此聚合路由1.1.1.0/24的Origin属性为IGP;当1.1.1.2/32被重新添加时,组成聚合路由的具体路由有Origin属性为IGP的1.1.1.1/32和Origin属性为Incomplete的1.1.1.2/32,因此聚合路由1.1.1.0/24的Origin属性为Incomplete。因此1.1.1.2/32发生的震荡导致了聚合路由1.1.1.0/24的Origin属性发生变化。又因为Router C上通过dampening命令配置了BGP路由衰减,因此聚合路由1.1.1.0/24触发了Router C的路由抑制。

(4)     使聚合路由1.1.1.0/24的Origin属性固定为IGP。

a.     创建一个名为policy1的路由策略,其节点序列号为10,匹配模式为permit,且设置该BGP路由的路由源为IGP。

<RouterD> system-view

[RouterD] route-policy policy1 permit node 10

[RouterD-route-policy-policy1-10] apply origin igp

b.     在BGP IPv4单播地址族视图下,配置在BGP路由表中创建一条聚合路由1.1.1.0/24,且根据路由策略policy1设置聚合路由的属性。

<RouterD> system-view

[RouterD] bgp 200

[RouterD-bgp-default] address-family ipv4 unicast

[RouterD-bgp-default-ipv4] aggregate 1.1.1.0 255.255.255.0 attribute-policy policy1

13.3  根因

具体路由发生震荡导致聚合路由Origin属性变化,从而触发路由抑制。

13.4  解决方案

通过路由策略使聚合路由的Origin属性固定不变。

14 VPN网络中CE设备Tracert回显地址错误

14.1  问题描述

图14-1所示,设备在VPN网络为PE1和PE2。当使用tracert命令查看CE1到CE2之间VPN业务的路径时,发现回显地址异常,出现不是路径上的地址,但业务流量转发正常。

图14-1 组网图

设备

接口

IP地址

设备

接口

IP地址

CE 1

XGE3/1/1

30.0.0.2/24

P

Loop0

-

PE 1

Loop0

8.8.8.8/32

 

XGE3/1/1

-

 

XGE3/1/1

30.0.0.1/24

 

XGE3/1/2

-

 

XGE3/1/2

-

PE 2

Loop0

-

CE 2

XGE3/1/1

20.0.0.2/24

 

XGE3/1/1

20.0.0.1/24

 

 

 

 

XGE3/1/2

-

 

14.2  处理过程

说明

以下显示信息仅为示例,并非设备实际的软、硬件信息。

 

(1)     分别在CE1和CE2端使用tracert命令查看业务路径的回显地址是否异常。

# 从CE1 tracert CE2。

[CE1] tracert 20.0.0.2

traceroute to 20.0.0.2 (30.0.0.2), 30 hops at most, 40 bytes each packet, press CTRL+C to break

1   30.0.0.1 (30.0.0.1)  1.000 ms  0.000 ms  1.000 ms

……

11  20.0.0.1 (20.0.0.1) [AS 65002]  1.000 ms  1.000 ms  1.000 ms

12  20.0.0.2 (20.0.0.2) [AS 65002]  2.000 ms  2.000 ms  2.000 ms

回显地址显示正常。第1跳为直连地址,第11跳为CE2的直连地址。

# 从CE2 tracert CE1。

[CE2] tracert 30.0.0.2

traceroute to 30.0.0.2 (30.0.0.2), 30 hops at most, 40 bytes each packet, press CTRL+C to break

1   20.0.0.1 (20.0.0.1)  0.000 ms  1.000 ms  0.000 ms

……

11  8.8.8.8 (8.8.8.8)  2.000 ms  1.000 ms  2.000 ms

12  30.0.0.2 (30.0.0.2) [AS 65001]  2.000 ms  1.000 ms  3.000 ms

回显地址显示异常。第11跳正常情况下应为CE2的直连地址,但是实际显示的地址为8.8.8.8。

业务转发和tracert的最后一跳正常说明路由、接口无异常。

(2)     通过display ip interface brief命令在PE1查看是否存在8.8.8.8的地址。

[PE1] display ip interface brief

*down: administratively down

(s): spoofing  (l): loopback

Interface           Physical Protocol IP address/Mask    VPN instance Description

XGE3/1/1            up       up       30.0.0.1/24        v1           --

XGE3/1/2            up       up       1.1.1.2/8          --           --

Loop1               up       up(s)    2.2.2.2/32         --           --

Loop0               up       up(s)    8.8.8.8/32         v1           --

发现8.8.8.8的接口也绑定了VPN。

(3)     使用抓包软件抓包,查看设备的tracert回包地址是否正确。

 

发现设备回包地址确实为8.8.8.8。

14.3  根因

此现象为产品正常处理报文的现象。在VPN网络中,设备在处理tracert报文时,若不是直连下一跳,设备将绑定VPN业务的所有接口中最小的IP地址作为源IP发送ICMP报文,因此导致tracert回显信息与预期不符。

非VPN的流量不存在此问题。

14.4  解决方案

此现象为产品正常处理报文的现象,只是tracert回显的结果差异,不影响实际报文转发。

15 等价路由出接口为三层聚合接口时,成员口端流量负载不均

15.1  问题描述

设备到目的地址有两条等价静态路由,出接口为两个三层聚合接口,分别是Route-Aggregation1与Route-Aggregation2,每个三层聚合口有两个成员端口。对于两个成员端口,出现流量负载不均的情况,例如:一个100GE成员端口流量负载为该接口总带宽的70%,另一个100GE成员端口流量负载基本为空。

15.2  处理过程

说明

以下显示信息仅为示例,其他等价路由出接口为三层聚合接口情况下聚合成员口端负载不均情况,请以设备实际显示为准。

 

(1)     通过display link-aggregation verbose命令显示已有聚合接口所对应聚合组的详细信息,确认两个成员端口均为选中状态。

<Sysname> display link-aggregation verbose

Loadsharing Type: Shar -- Loadsharing, NonS -- Non-Loadsharing

Port Status: S -- Selected, U -- Unselected, I -- Individual

Port: A -- Auto

Flags:  A -- LACP_Activity, B -- LACP_Timeout, C -- Aggregation,

        D -- Synchronization, E -- Collecting, F -- Distributing,

        G -- Defaulted, H -- Expired

 

Aggregate Interface: Route-Aggregation1

Aggregation Mode: Static

Loadsharing Type: Shar

  Port             Status  Priority Oper-Key  Role

  HGE3/1/1         S       32768    8         None

  HGE3/1/2         S       32768    8         None

 

Aggregate Interface: Route-Aggregation2

Aggregation Mode: Static

Loadsharing Type: Shar

  Port             Status  Priority Oper-Key  Role

  HGE3/1/1         S       32768    8         None

  HGE3/1/2         S       32768    8         None

(2)     流量到达设备后,先检查路由表,匹配到两条等价路由。

a.     匹配到两条等价路由后,设备进行第一次哈希算法,对三层聚合接口进行选路,目的是决定将业务流量从哪个三层聚合接口转发出去。选路过程可以大致理解为根据流量报文的五元组等特征,设备计算出一个哈希值,之后将该哈希值对2(等价路由条数)进行取模,模的结果不同,选取的等价路由就不同。

b.     假设此时流量哈希到等价路由1,对应的出接口为三层聚合接口Route-Aggregation1。业务流量在三层聚合接口Route-Aggregation1转发时,需要进行第二次哈希算法,对聚合组接口Route-Aggregation1上的成员端口进行选路,目的是决定将业务流量从聚合组上的哪个成员端口转发出去。该过程与第一次哈希算法的过程类似,设备根据流量特征计算出哈希值,对2(聚合组成员端口数目)取模,模的结果不同,选取的聚合组上成员端口就不同。

由于第一次哈希算法,对三层聚合口进行选路时,已经对流量做了筛选,因此走到Route-Aggregation1的流量,第二次哈希的结果会与第一次哈希的结果基本相同,也就会走到三层聚合接口上一个固定的成员端口进行转发,导致成员端口业务流量负载不均的现象。

基于上述分析,如果等价路由条目数与聚合组上的成员端口数目相同或者互为倍数关系时,则均有可能出现成员端口业务流量负载不均的情况。

15.3  根因

等价路由与链路聚合哈希参数一致,并且等价路由条目数与聚合组上的成员端口数目相同或者互为倍数关系时,导致成员端口业务流量负载不均的情况。

15.4  解决方案

·     对于聚合成员端口的情况,可以通过link-aggregation global load-sharing modeip load-sharing mode命令调整负载分担方式,使两次哈希过程产生差别,避免成员端口流量负载不均。关于link-aggregation global load-sharing modeip load-sharing mode命令详细介绍及使用指导,请参见《H3C SR8800-F路由器 命令参考》中以太网链路聚合或IP转发基础命令。

·     也可以对等价路由条目数或聚合接口进行调整,避免等价路由条目数与聚合组上的成员端口数目相同或者互为倍数关系。例如:在本案例中,可以修改等价路由条目数为2条、聚合组上的成员端口为3个等。

16 设备作为SSH客户端无法登录SSH服务端

16.1  问题描述

我司设备作为SSH客户端,在通过SSH登录SSH服务端时能正常输入用户名,但会一直处于连接状态中,不能进行下一步输入密码,无法登录到SSH服务端。

16.2  处理过程

说明

以下显示信息仅为示例,并非设备实际的软、硬件信息,请以组网环境中的实际情况为准。

 

(1)     检查设备和SSH服务端之间的连通性。

通过ping命令检查到SSH服务端12.1.1.1是否可达,能确认Ping结果不丢包,说明设备和SSH服务端之间连通性正常。

[Sysname] ping -a 12.1.1.2 12.1.1.1

Ping 12.1.1.1 (12.1.1.1) from 12.1.1.2: 56 data bytes, press CTRL+C to break

56 bytes from 12.1.1.1: icmp_seq=0 ttl=255 time=0.772 ms

56 bytes from 12.1.1.1: icmp_seq=1 ttl=255 time=0.627 ms

56 bytes from 12.1.1.1: icmp_seq=2 ttl=255 time=0.587 ms

56 bytes from 12.1.1.1: icmp_seq=3 ttl=255 time=0.605 ms

56 bytes from 12.1.1.1: icmp_seq=4 ttl=255 time=0.714 ms

 

--- Ping statistics for 12.1.1.1 ---

5 packet(s) transmitted, 5 packet(s) received, 0.0% packet loss

round-trip min/avg/max/std-dev = 0.587/0.661/0.772/0.071 ms

 

(2)     检查SSH服务端的SSH服务是否正常。

更换其它设备作为SSH客户端登录SSH服务端,能正常进行登录,说明SSH服务正常。

(3)     检查SSH服务端是否对于SSH登录的客户端进行了限制。

通过display current-configuration命令查看SSH服务器的配置,结果看到已通过引用ACL对SSH客户端进行了访问控制。

[Sysname]display current-configuration

 ssh server acl 2010                                                           

#                                                                              

acl basic 2010                                                                  

 description Manager_IP                                                        

 rule 5 permit                                                                  

#                                                                               

(4)     检查SSH客户端和SSH服务端之间的报文交互是否正常。

在SSH客户端上发起SSH连接请求,然后通过display tcp命令查看TCP连接摘要信息,结果没有看到SSH客户端和SSH服务端之间的TCP连接信息。

[Sysname] display tcp

 *: TCP connection with authentication

 Local Addr:port       Foreign Addr:port     State       Slot  PCB

 0.0.0.0:0             0.0.0.0:0             CLOSED      0     0x000000000002b895

 0.0.0.0:0             0.0.0.0:0             CLOSED      0     0x000000000002b892

 0.0.0.0:0             0.0.0.0:0             CLOSED      0     0x000000000002b88c

 0.0.0.0:21            0.0.0.0:0             LISTEN      0     0xffffffffffffffbe

 0.0.0.0:22            0.0.0.0:0             LISTEN      0     0xffffffffffffffbd

 0.0.0.0:23            0.0.0.0:0             LISTEN      0     0xffffffffffffff9d

 0.0.0.0:179           111.1.1.1:0           LISTEN      0     0xffffffffffffffa2

 0.0.0.0:179           120.1.1.1:0           LISTEN      0     0xffffffffffffffb0

 0.0.0.0:179           123.1.1.1:0           LISTEN      0     0xffffffffffffffa4

 0.0.0.0:179           133.1.1.1:0           LISTEN      0     0xffffffffffffffa8

 0.0.0.0:11111         0.0.0.0:0             LISTEN      1     0xffffffffffffff9d

 0.0.0.0:11111         0.0.0.0:0             LISTEN      2     0xffffffffffffff9d

(5)     检查TCP相关配置是否影响了TCP连接建立。

通过display current-configuration命令查看设备的配置,结果看到设备已配置了攻击防范功能,使得设备丢弃了从对端发送回来的SSH的TCP报文,导致SSH连接失败。

[Sysname]display current-configuration

#                                                                              

 tcp syn-COOKIE enable                                                          

 tcp anti-naptha enable                                                        

 tcp anti-syn-flood flow-based enable                                          

 tcp anti-syn-flood interface-based enable                                      

#                                                                              

16.3  根因

通过现场配置检查,发现实际作为SSH客户端的设备与SSH服务端配置的攻击防范功能不匹配,导致设备无法正常通过SSH连接登录到SSH服务端。

16.4  解决方案

通过配置undo tcp anti-syn-flood flow-based enable命令关闭基于流的TCP SYN Flood攻击防范功能后,设备作为SSH客户端通过SSH登录SSH服务端,能正常输入用户名和口令成功登录到SSH服务端。

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们