整本手册
本章节下载 (897.05 KB)
目 录
2.2 VCF控制器安装时控制台与服务器断开,无法继续安装的问题。
3.1 在上传本地License文件时,提示“License文件有误”
4.1.1 创建集群时,提示“网卡配置不正确,集群创建失败”
4.1.2 创建集群时,提示“集群创建失败,集群成员集群Token不一致”
4.1.3 创建集群时,提示“不能在当前角色为Member的集群成员控制器上创建集群”
12.9 KVM主机上线后,控制器无法获取VXLAN隧道接口
12.10 KVM主机上线后,控制器无法获取UPLINK接口
12.11 Underlay网络VTEP IP地址和VSR网关无法互通
12.12 Underlay网络VTEP IP地址和TOR网关无法互通
13.2 网关型防火墙处于Active状态,但防火墙并未生效
13.4 服务链型防火墙处于Active状态,但防火墙并未生效
本文档介绍H3C VCF控制器常见故障的诊断及处理措施。
当出现故障时,请尽可能全面、详细地记录现场信息(包括但不限于以下内容),收集信息越全面、越详细,越有利于故障的快速定位。
· 记录您所使用的H3C VCF控制器版本、Linux操作系统版本。
· 记录具体的故障现象、故障时间、配置信息。
· 记录完整的网络拓扑,包括组网图、端口连接关系、故障位置。
· 收集日志信息和诊断信息(收集方法见1.2 收集故障诊断信息)。
· 记录现场采取的故障处理措施及实施后的现象效果。
您可以通过如下步骤,查看VCF控制器的诊断信息。
(1) 在浏览器(如Chrome)中输入控制器GUI的登录地址(格式为:https://controller_ip_address:8443/sdn/ui/),回车后打开控制器GUI的登录界面。输入用户名和密码后,单击<登录>按钮进入控制器GUI首页。
(2) 在控制器GUI界面中,单击[控制器/系统管理/诊断信息]菜单项,进入诊断信息页面,如图1-1所示。然后单击右上角的<导出>按钮,弹出“诊断信息导出”对话框,如图1-2所示。在弹出的对话框中选择需要导出诊断信息的控制器,单击<导出>按钮,将导出的诊断日志信息保存到本地。
· 如果因网络中的策略限制问题,导致无法使用https方式登录,可以通过http方式登录,输入http://controller_ip_address/sdn/ui/或http://controller_ip_address:8080/sdn/ui/,登录控制器GUI界面。
· 集群模式下,主Leader控制器有权限导出集群内所有处于激活状态的控制器诊断信息,而Member控制器仅能导出本控制器的诊断信息。
· 在已弹出的“诊断信息导出”对话框中,每台控制器的诊断信息仅能成功导出一次,如需对同一台控制器的诊断信息再次导出,请关闭对话框后重新打开。
当故障无法自行解决时,请准备好设备运行信息、故障现象等材料,发送给H3C技术支持人员进行故障定位分析。
用户支持邮箱:service@h3c.com
技术支持热线电话:400-810-0504(手机、固话均可拨打)
在安装VCF控制器之前,请提前规划好VCF控制器的IP地址,避免和网络中其它设备的IP地址冲突。
安装VCF控制器时,提示“pre-dependency problem - not installing vcf-controller”报错信息,如图2-1所示。
图2-1 安装VCF控制器时的报错信息
造成故障的原因可能为未正确安装VCF控制器依赖的软件包。
故障处理步骤如下:
(1) 建议通过安装H3C提供的在线安装依赖软件包的方式排除故障。在线安装控制器依赖软件包的方法,请参见《H3C VCF控制器安装指导》。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
通过SSH与服务器建立连接并在服务器上安装VCF控制器时,若SSH连接中断,则无法继续安装。
出现上述问题时,请根据如下步骤卸载并重新安装控制器。
(1) 重新建立SSH连接,然后在命令提示符界面依次执行以下命令,来终止VCF控制器的相关进程:
[root@localhost ~]# systemctl stop sdnc
[root@localhost ~]# systemctl stop sdna
[root@localhost ~]# systemctl stop handshake
如果系统不支持上面的命令,则用下面的命令代替:
[root@localhost ~]# service sdnc stop
[root@localhost ~]# service sdna stop
[root@localhost ~]# service handshake stop
(2) 根据是否需要保留配置,可以有以下两种方式:
· 如果不需要保留配置数据,执行以下命令:
[root@localhost ~]# rpm -e vcf-controller
Do you want to purge the package? [Y/N]:Y
· 如果需要保留配置,执行以下命令卸载掉未安装完全的控制器:
[root@localhost ~]# rpm -e --nopreun vcf-controller
Do you want to purge the package? [Y/N]:N
(3) 卸载完成后重新安装所需版本的控制器,安装过程请参见《H3C VCF控制器安装指导》。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
VCF控制器安装后立刻断电重启,重启后无法访问控制器GUI页面。
造成故障的原因可能为断电造成的启动文件错误,导致控制器进程无法启动。
故障处理步骤如下:
(1) 登录控制器所在服务器的操作系统,查看/opt/sdn/virgo/work目录下的ext.index文件大小是否为0,如果大小为0,请删除此文件,然后重启服务器。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
用户上传控制器的本地License文件时提示“License文件有误”报错信息。
造成故障的原因可能有如下几种:
· 上传的本地License文件不是为本控制器申请的。
· 控制器所在的服务器或虚拟机更换过CPU、网卡等硬件。
故障处理步骤如下:
(1) 请为控制器重新申请License文件。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
生成的设备信息文件名称为Error.txt,内容为“Dependent software libvirt is required.”。
造成故障的原因可能为未正确安装VCF控制器依赖的Libvirt软件包。
故障处理步骤如下:
(1) 安装Libvirt软件包,安装方法请参见《H3C VCF控制器安装指导》。
(2) 单击<获取主机信息>按钮重新生成设备信息文件。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
单控制器或集群中所有控制器全部重启后,与License server成功建立连接,并且在License server上显示License已安装,但控制器或集群获取不到远端License的授权信息。
造成故障的原因可能为控制器或集群重启后,与License server的连接中断,而License server上会等待老化时间结束后再回收授权数据。在老化时间结束前,即使与License server成功建立连接也不会获取到授权信息。
故障处理步骤如下:
(1) 登录到License server的管理界面,在客户端管理的连接管理页面中将对应的客户端强制下线。
(2) 登录到VCF控制器,单击[控制器/License管理]菜单项,在远端License页面断开与License server的连接,并重新建立连接。
创建集群时,提示“网卡配置不正确,集群创建失败”。
(1) 检查控制器所在服务器或者虚拟机的网卡是否正常,如果网卡已禁用,请使用ifconfig命令启动网卡;如果是硬件故障,请更换网卡,然后重新创建集群。
(2) 如果是网卡输入错误,请从“增加控制器”页的控制器列表中删除网卡错误的控制器,重新添加控制器并通过下拉框方式选择正确网卡,然后重新创建集群。
(3) 如果通过下拉框方式无法显示远端Leader控制器的网卡列表,请检查网络是否连通,如果网络连通正常,则请进一步检查各Leader控制器的集群Token是否一致,查看集群Token的方法为:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,在单机配置页面中可以查看当前控制器的集群Token信息。
(4) 如果各Leader控制器的集群Token不一致,需要通过如下方法修改集群Token后再重新创建集群。
· 方法一:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,如果当前集群Token未创建,则在集群Token输入框中输入集群Token后单击<创建>按钮;如果当前集群Token已创建,则单击集群Token输入框后的<删除>按钮删除当前集群Token,然后在集群Token输入框中输入新的集群Token,再单击<创建>按钮。
· 方法二:将需要修改集群Token的控制器卸载后重装,在安装过程提示输入集群Token时,输入与其它Leader控制器相同的集群Token。卸载和重装控制器的方法请参见《H3C VCF控制器安装指导》。
(5) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
创建集群时,提示“集群创建失败,集群成员集群Token不一致”。
该问题是由于创建集群的各Leader控制器的集群Token不一致造成的。解决方法如下:
(1) 查看集群中各Leader控制器的集群Token,查看方法为:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,在单机配置页面中可以查看当前控制器的集群Token信息。
(2) 修改Leader控制器的集群Token,使得各Leader控制器的集群Token一致。修改方法为:
· 方法一:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,如果当前集群Token未创建,则在集群Token输入框中输入集群Token后单击<创建>按钮;如果当前集群Token已创建,则单击集群Token输入框后的<删除>按钮删除当前集群Token,然后在集群Token输入框中输入新的集群Token,再单击<创建>按钮。
· 方法二:将需要修改集群Token的控制器卸载后重装,在安装过程提示输入集群Token时,输入与其它Leader控制器相同的集群Token。卸载和重装控制器的方法请参见《H3C VCF控制器安装指导》。
(3) 待集群Token修改完毕后,重新创建集群。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
创建集群时,提示“不能在当前角色为Member的集群成员控制器上创建集群”。
(1) 请将当前控制器设置为Leader角色,或者登录到角色为Leader的控制器上创建集群。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
由于网络不可达,导致成员控制器无法和Leader控制器交互信息,或者在删除集群时,由于成员控制器下线等原因导致未同步删除集群配置信息,使得成员控制器无法清除集群配置信息。
只有运行角色为Leader的控制器才有删除集群的权限。当网络中不存在具备删除权限的控制器用于清理集群配置时,就会导致Member控制器残留集群配置。
(1) 如果集群未删除,请确保Member控制器与Leader控制器之间网络可达后再尝试删除集群。
(2) 如果集群已删除,请通过Member控制器逐一退出集群的方式清除集群配置。操作方法为:
a. 登录Member控制器GUI界面。单击[控制器/控制器配置]菜单项,进入控制器配置页面。
b. 单击“修改集群”链接,进入修改集群页面,在控制器列表中,单击所登录控制器对应“操作”列中的按钮。
c. 在弹出的操作确认对话框中单击<确认>按钮,完成所登录的控制器退出集群的操作。
d. 重复上述a~c步骤,使所有残留集群配置的Member控制器逐一退出集群。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
向集群中动态添加集群成员时,成员控制器无法成功加入。
(1) 检查成员控制器和主Leader控制器之间HTTPS连接是否正常,可以在成员控制器上尝试ping集群IP地址,如果无法ping通,请参见“4.4 集群IP地址登录失败”。
(2) 检查成员控制器配置是否存在错误,例如IP地址或名称与集群内已有成员是否重复。如果是成员控制器IP地址、名称重复等错误,请根据提示修改相应配置信息。
(3) 查看集群内成员数目是否已经达到规格上限,如果已经满规格,则无法加入。请重新规划集群成员,只有将原有集群成员退出后才能重新加入新成员。
(4) 检查待加入集群的控制器和集群主Leader控制器的集群token是否一致,如果不一致,请修改待加入集群的控制器的集群Token,具体方法如下:
· 方法一:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,如果当前集群Token未创建,则在集群Token输入框中输入集群Token后单击<创建>按钮;如果当前集群Token已创建,则单击集群Token输入框后的<删除>按钮删除当前集群Token,然后在集群Token输入框中输入新的集群Token,再单击<创建>按钮。
· 方法二:将需要修改集群Token的控制器卸载后重装,在安装过程提示输入集群Token时,输入新的集群Token。卸载和重装控制器的方法请参见《H3C VCF控制器安装指导》。
(5) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
无法通过集群IP地址登录集群,或ping不通集群IP地址。
(1) 在PC上ping主Leader的IP地址,如果无法ping通,请排查PC和主Leader所属网段之间的网络连通性。
(2) 检查主Leader控制器上是否存在集群IP地址,可以通过单击[控制器/控制器信息]或[运维监控/控制器信息]菜单项查看。如果不存在集群IP地址,请单击[控制器/控制器配置]菜单项,然后单击“修改集群”链接,进入修改集群页面。再单击<修改集群>按钮,在弹出的对话框中填写集群IP地址和子网掩码,单击<应用>按钮来创建集群IP地址。
(3) 登录主Leader控制器所在的服务器或者虚拟机,使用ifconfig命令查看设置的网卡上是否存在集群IP地址。如果无集群IP地址,请检查网卡是否禁用,如果已禁用,请使用ifconfig命令启动网卡。
(4) 检查网络中是否存在集群IP地址冲突,如果存在,请登录主Leader控制器,把集群IP地址修改为当前网络中唯一的IP地址。
(5) 在浏览器所在主机,也就是登录控制器的主机上查看ARP表项,确认集群IP地址所对应的MAC地址是否为主Leader控制器上集群IP地址对应网卡的MAC地址。如果不是,则表明ARP表项不正确,请删除ARP表项,然后重新ping集群IP地址。
(6) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
查看成员控制器的状态信息,显示为down。
(1) 在控制器信息页面中,查看控制器信息列表备注栏的提示,如果显示“控制器IP不可达”或“连接超时”,请检查控制器是否宕机或网络是否中断。如果控制器宕机请重新上电或者重新安装控制器;如果网络故障,请排查故障线路,确保网络可达。
(2) 在控制器信息页面中,查看控制器信息列表备注栏的提示,如果显示“该控制器同时存在于两个集群中”,请根据需求将控制器退出之前加入或新加入的集群。
(3) 在控制器信息页面中,查看控制器信息列表备注栏的提示,如果显示“集群Token认证失败”,请通过如下方法解决:
a. 查看集群中各Leader控制器的集群Token,查看方法为:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,在单机配置页面中可以查看当前控制器的集群Token信息。
b. 修改控制器的集群Token,使得各控制器的集群Token一致。修改方法为:
¡ 方法一:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,如果当前集群Token未创建,则在集群Token输入框中输入集群Token后单击<创建>按钮;如果当前集群Token已创建,则单击集群Token输入框后的<删除>按钮删除当前集群Token,然后在集群Token输入框中输入新的集群Token,再单击<创建>按钮。
¡ 方法二:将需要修改集群Token的控制器卸载后重装,在安装过程提示输入集群Token时,输入与其它Leader控制器相同的集群Token。卸载和重装控制器的方法请参见《H3C VCF控制器安装指导》。
c. 修改集群Token后,重新创建集群或者将控制器加入集群。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
设备属于某一Region,但是在控制器GUI界面,单击[运维监控/设备信息]菜单项,进入设备信息页面中,却无法查看到设备的Region信息。
(1) 确认是否由于用户手动配置Datapath ID不当,使得多台设备的Datapath ID相同而造成冲突。确认方法为:单击[运维监控/设备信息]菜单项,进入设备信息页面中,查看设备IP地址对应的Datapath ID,在设备上将该Datapath ID对应的OpenFlow实例断开。再次进入设备信息页面,查看设备的Datapath ID是否仍然存在,如果存在,则表明因设备的Datapath ID相同而造成冲突。
(2) 根据设备信息页面显示的设备IP地址,找到对应的另一台Datapath ID相同的设备,修改Datapath ID,解决Datapath ID冲突问题。
(3) 登录手动断开OpenFlow实例的设备,重新连接OpenFlow实例。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
一个OpenFlow实例连接属于不同Region的多个控制器,导致网络设备和控制器上的Master角色不一致。
将一个OpenFlow实例配置为连接到属于不同Region的多个控制器,控制器会根据自身配置向设备下发角色信息,OpenFlow实例上的控制器角色信息会以连接的任意控制器最后一次下发的角色信息为准,导致之前下发的角色信息被覆盖,从而改变Region中控制器的角色。比如RegionA中控制器a的角色是Master,控制器b的角色是Subordinate,RegionB中控制器c的角色是Master,控制器d的角色是Subordinate,如果同一个OpenFlow实例先后与a,b,c,d四台控制器建立连接,那么在OpenFlow实例上显示以控制器c为Master,其他三台控制器都是Subordinate,而在控制器上来看,控制器a和c都认为自己是该OpenFlow实例的Master。可通过如下步骤进行故障处理:
(1) 确保一个OpenFlow实例只受控于一个Region内的两台控制器,可按如下两种方式处理:
· 处理方案一:以设备的配置为准,首先确保设备上的OpenFlow实例只连接了两台控制器,如果多于两台,请删除多余的配置,然后修改Region配置,将OpenFlow实例连接的两台控制器配置到一个Region内。
· 处理方案二:以控制器配置为准,修改设备的OpenFlow配置,使其OpenFlow实例连接到一个Region内的两台控制器上。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
创建/修改Region,提示某台控制器配置失败。
可能是网络故障或集群Token不一致导致的,可通过如下步骤进行故障处理:
(1) 在控制器信息页面中,查看控制器信息列表备注栏的提示,如果显示“控制器IP不可达”,请检查控制器是否宕机或网络是否中断。如果控制器宕机请重新上电或者重新安装控制器,如果网络故障,请排查故障线路,确保网络可达。
(2) 在控制器信息页面中,查看控制器信息列表备注栏的提示,如果显示“集群Token认证失败”,请通过如下方法解决:
a. 查看集群中正常控制器的集群Token,查看方法为:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,在单机配置页面中可以查看当前控制器的集群Token信息。
b. 修改控制器的集群Token,使得各控制器的集群Token一致。修改方法为:
¡ 方法一:登录控制器GUI界面后,单击[控制器/控制器配置]菜单项,然后单击“单机配置”链接进入单机配置页面,如果当前集群Token未创建,则在集群Token输入框中输入集群Token后单击<创建>按钮;如果当前集群Token已创建,则单击集群Token输入框后的<删除>按钮删除当前集群Token,然后在集群Token输入框中输入新的集群Token,再单击<创建>按钮。
¡ 方法二:将需要修改集群Token的控制器卸载后重装,在安装过程提示输入集群Token时,输入与其它Leader控制器相同的集群Token。卸载和重装控制器的方法请参见《H3C VCF控制器安装指导》。
c. 修改集群Token后,重新创建集群或者将控制器加入集群。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
导出集群内控制器诊断信息时,控制器诊断信息未成功导出或者导出的压缩包不能正常进行解压。
造成故障的原因可能为:受CPU过于繁忙、网络不稳定、日志过大等因素的影响,在导出集群诊断信息的时候与某台控制器连接超时,导致无法正常导出该控制器的诊断信息。
可通过如下三种方式获取该控制器的诊断信息:
· 登录出现异常的控制器GUI界面,在该控制器上再次导出诊断信息。
· 在主Leader控制器的诊断信息页面上再次单击<导出>按钮,在弹出的“诊断信息导出”对话框中选择出现异常的控制器,导出诊断信息。
· 通过SSH登录到出现异常的控制器所在的服务器或虚拟机,进入/opt/sdn/virgo/serviceability/logs目录下,使用FTP等文件传输工具获取需要的诊断信息日志文件。
在OpenFlow设备上配置好OpenFlow连接,但在控制器上,单击[运维监控/设备信息]菜单项,在进入的设备信息页面中无法监控到该网络设备的相关信息。
造成故障的原因可能有如下几种:
· OpenFlow设备配置的控制器IP地址错误。
· 控制器与OpenFlow设备IP地址不可达。
· 受限于控制器的OpenFlow节点数License规格。
故障处理步骤为:
(1) 登录OpenFlow设备,检查设备上的配置是否正确,确保配置的控制器IP地址是正确的,如果不正确,请在设备上重新配置控制器IP地址,方法如图7-1所示。
图7-1 设备上的OpenFlow基本配置示意图
(2) 确保OpenFlow设备到控制器的IP地址是可达的,如果不可达,请排查网络故障。
(3) 通过display openflow summary命令查看OpenFlow是否已成功建立连接通道,如图7-2所示。
图7-2 网络设备OpenFlow连接状态示意图
如果连接通道状态不是Connected,在[控制器/控制器信息]下查看OpenFlow总连接数是否小于等于[控制器/License管理]中所示的远端License OpenFlow节点数与本地License OpenFlow节点数的总和。如果OpenFlow节点数的总和过小,请升级本地License或者远端License。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
控制器和OpenFlow设备建立好OpenFlow连接后,出现控制器与网络设备连接时断时续的现象。
造成故障的原因可能有如下几种:
· 当前网络不通畅。
· 单个Region中流量过大。
故障处理步骤为:
(1) 检查当前网络配置,确保当前网络环境稳定。网络不通畅,可导致连接不稳定。
(2) 单个Region中流量过大,可导致网络拥塞,OpenFlow保活报文不能正常交互。请检查当前OpenFlow连接的TCP通道是否繁忙,在控制器所在的操作系统上通过root用户权限执行netstat -anp | grep 6633命令,如图7-3所示。如果第1列(recive buff)和第2列(send buff)都持续保持较高的状态(200K~250K),请将本台控制器上连接的部分OpenFlow设备迁移到其它控制器上,尽量保持流量均匀。
图7-3 TCP通道状态示意图
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
控制器和OpenFlow设备建立好OpenFlow连接后,在控制器GUI界面上,单击[运维监控/设备信息]菜单项,在进入的设备信息页面中已监控到设备信息,但无法查看概要、端口、流表和组表信息。
造成故障的原因可能有如下几种:
· OpenFlow连接异常。
· 同步控制器的Region配置异常。
故障处理步骤为:
(1) 登录OpenFlow设备,通过display openflow instance instance-id controller(以instance 1为例)命令查看OpenFlow连接是否正常,控制器角色是否下发正常,如图7-4所示。如果都是equal状态,请在控制器上创建一个Region或者将OpenFlow设备连接到Region中。
(2) 确保设备同步的控制器的Region配置正常,查看[运维监控/设备信息]中设备的“Region”列是否存在,如图7-5所示,如果不存在,请在控制器GUI界面中,单击[控制器/系统管理/诊断信息]菜单项,进入诊断信息页面,然后单击<导出>按钮,在弹出的对话框中选择需要导出诊断信息的控制器,单击<导出>按钮导出诊断信息。查看RegionInfo文件夹下的日志,在Global Master Cache项中查看是否存在该设备MAC地址对应的记录。如果没有,在OpenFlow设备上断开与控制器的连接后重新连接(如果业务流量可以正常处理,只是无法查看设备的概要、端口、流表和组表信息,不建议进行本操作)。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
控制器和设备建立好OpenFlow连接后,通过REST API静态方式下发流表项或者业务触发动态方式下发流表项,但设备上未查询到相关流表项信息。
造成故障的原因可能有如下几种:
· 设备的OpenFlow能力集不支持下发流表。
· 设备不识别Experimenter数据。
· 设备不能收到控制器的FlowMod消息。
故障处理步骤为:
(1) 确认设备的OpenFlow能力集是否支持下发流表项。设备的OpenFlow能力集请通过REST API的GET /sdn/v2.0/of/datapaths/{dpid}/features/match获取。如果设备的OpenFlow能力集不支持下发流表项,请升级设备或更换设备。
(2) 若流表项中包含Experimenter数据,请根据设备手册确认设备是否识别Experimenter数据,如果不识别,请升级或更换设备。
(3) 打开设备的调试开关,观察是否可以成功接收到控制器的FlowMod消息。如果否,请检查控制器与设备的连接是否正常,具体方法请参见“7.2 控制器与OpenFlow设备连接不稳定”;如果是,请继续进行下一步。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
上层应用下发NETCONF配置失败,例如添加物理网元后,新增的物理网元状态为Inactive,并提示“OpenFlow连接失败”或“NETCONF连接失败”。
(1) 确认网络设备与控制器端物理连接是否中断。分别登录控制器和网络设备,查看物理端口的网线连接是否正常,链路状态是否UP。
(2) 确认网络设备和控制器的NETCONF相关配置是否一致。如网络设备是否开启了基于HTTPS的NETCONF over SOAP功能;控制器使用的NETCONF用户名和密码与网络设备上的NETCONF用户名和密码是否一致。若不一致,请修改网络设备或控制器的NETCONF配置。
(3) 确认网络设备和其它设备建立的NETCONF会话数是否已达上限。因为网络设备能够建立的NETCONF会话数有限,如果网络设备和其它设备建立的NETCONF会话已达上限,就无法再和控制器建立NETCONF会话,此时需要删除网络设备和其它设备建立的NETCONF会话或调整网络设备的NETCONF会话上限。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
物理网元创建后一直是Inactive状态,无法激活。
造成故障的原因可能有如下几种:
· 受限于License规格。
· 物理网元与控制器网络不通。
· 该网元是物理网关设备,但未加入网关组。
· 控制器与物理网元之间的NETCONF通信失败。
· 集群模式下,Region自动配置失败。
· 单机模式下,未配置单机控制器IP地址。
故障解决办法:
(1) 控制器能够激活的物理网元数分别受OpenFlow节点数License和Overlay硬件网元License控制,请分别检查两者的License规格是否已达上限。如果是,建议进行License扩容;如果否,请继续进行下一步。
(2) 检查物理网元管理IP地址与控制器IP地址是否能够ping通。如果否,请排查网络故障;如果是,请继续进行下一步。
(3) 检查物理网元类型,如果网元类型是物理网关设备,请确保物理网关设备已加入到网关组。
(4) 检查控制器与物理网元之间的NETCONF通信是否正常,具体方法可以参见“8 NETCONF故障处理”。
(5) 如果控制器运行在集群模式,请检查物理网元是否已选择Region(可以通过单击控制器界面的[承载网络/物理网元]菜单项查看)。如果显示“---”,则表示Region选择失败,请参见“9.3 集群模式下,网元自动配置Region失败”;如果显示Region的名称,则表示Region已选择,请继续进行下一步。
(6) 如果控制器运行在单机模式,请检查控制器是否配置了单机控制器IP地址(可以通过单击控制器界面的[控制器/控制器配置/单机配置]菜单项查看)。如果未配置,请配置单机控制器IP地址;如果已配置单机控制器IP地址,请继续进行下一步。
(7) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
VNF网元创建后一直是Inactive状态,无法激活。
造成故障的原因可能有如下几种:
· 受限于License规格。
· VNF网元与控制器网络不通。
· 集群模式下,Region自动配置失败。
· 单机模式下,未配置单机控制器IP地址。
故障解决办法:
(1) 控制器能够激活的VNF网元数受OpenFlow节点数License控制,请检查OpenFlow节点数License规格是否已达上限,如果是,建议进行License扩容;如果否,请继续进行下一步。
(2) 检查VNF网元管理IP地址与控制器IP地址是否能够ping通。如果否,请排查网络故障;如果是,请继续进行下一步。
(3) 如果控制器运行在集群模式,请检查VNF网元是否已选择Region(可以通过单击控制器界面的[承载网络/VNF网元/资源节点列表]查看)。如果显示“---”,则表示Region选择失败,请参见“9.3 集群模式下,网元自动配置Region失败”;如果显示Region的名称,则表示Region已选择,请继续进行下一步。
(4) 如果控制器运行在单机模式,请检查控制器是否配置了单机控制器IP地址(可以通过单击控制器界面的[控制器/控制器配置/单机配置]菜单项查看)。如果未配置,请配置单机控制器IP地址;如果已配置单机控制器IP地址,请继续进行下一步。
(5) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
在集群模式下创建网元后,网元自动选择Region失败。
造成故障的原因可能有如下几种:
· 未配置Region。
· 已配Region的管理设备网段不包含网元的管理IP地址。
故障解决办法:
(1) 在[首页/概览]页面的“控制器”区域,检查集群是否配置Region。如果否,请为集群配置对应的Region;如果是,请继续进行下一步。
(2) 在[首页/概览]页面,单击“控制器”区域中相应的Region图标进入Region详细信息页面,检查Region的“管理设备网段”是否包含网元的管理IP地址。如果否,请在[控制器/控制器配置/修改Region]界面的“操作”区段,将网元IP地址所属网段添加到Region的管理设备网段中,或者新建一个未配置管理设备网段的Region;如果是,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
在控制器上配置“VNFM信息”及“VTEP地址池”后,向VNF Manager发起申请资源的请求,在控制器上提示“从VNFM获取资源失败”。
造成故障的原因可能有如下几种:
· VNF Manager上已存在同名的VNF资源。
· 控制器上的“VNFM信息”配置错误。
· 控制器与VNF Manager网络不通。
· 控制器申请的资源在VNF Manager上没有对应的模板。
· VNF Manager上创建的虚拟机数已经饱和。
故障解决办法:
(1) 检查VNF Manager上是否已存在同名的资源。如果是,申请其他名称的VNF资源或删除已存在的同名资源(只有在该VNF资源没有被引用的情况下才可以被删除);如果否,请进行下一步。
(2) 检查控制器上的“VNFM信息”配置是否正确。如果否,请修改配置;如果是,请继续进行下一步。
(3) 检查控制器IP地址与VNF Manager IP地址是否能够ping通。如果否,请排查网络故障;如果是,请继续进行下一步。
(4) 登录VNF Manager的管理界面,查看是否存在申请资源类型的模版。如果是,请创建相应的资源模板;如果否,请继续进行下一步。
(5) 登录VNF Manager的管理界面,查看VNF Manager各种资源的使用情况,如图9-1所示,请根据实际需求进行扩容。
图9-1 VNFM信息示意图
(6) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
控制器从OpenStack导入租户失败。
造成故障的原因可能有如下几种:
· 控制器上“从OpenStack导入租户”的配置错误。
· 控制器与OpenStack的网络不通。
故障解决办法:
(1) 检查控制器上“从OpenStack导入租户”的配置是否正确。如果否,请修改相应配置;如果是,请继续进行下一步。
(2) 检查控制器IP地址与OpenStack IP地址是否能够ping通。如果否,请排查网络故障;如果是,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
接入设备下的主机执行Ping指令操作,无法学习到MAC地址。
(1) 请确保与源、目的主机连接的接入设备已与控制器建立好OpenFlow连接。
(2) 检测主机对应的vPort信息配置是否正确,包括IP地址、MAC地址,以及主机归属的VLAN或VXLAN网络信息。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
接入设备侧主机启动后,使用ARP模块的REST API查看不到相应的主机信息。
(1) 确保控制器上已配置与主机相连的接入设备类型的物理网元。
(2) 确保接入设备类型的物理网元处于激活状态,如果否,检查物理网元配置的用户名和密码等信息是否正确;如果是,请继续下一步。
(3) 接入设备类型的物理网元激活后,在物理网元上确认是否存在ARP报文上送到控制器的流表,如果存在,则在当前主机上执行ping指令,尝试访问其他主机,通过源主机发送的报文促使控制器学习到主机信息;如果不存在,请继续进行下一步。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
登录控制器,单击[虚拟网络/计算域],单击“主机”页签,在该主机界面无法添加主机,提示“无法连接到主机”。
造成故障的原因可能有如下几种:
· vSwitch没有正确配置网桥。
· 主Leader控制器与添加的vSwitch无法互通。
故障处理步骤为:
(1) 检查vSwitch是否配置了网桥,如果否,请配置网桥,且网桥名称必须与VDS中的网桥名称一致;如果是,请继续进行下一步。
(2) 检查vSwitch是否配置了VXLAN隧道接口,如果否,请配置VXLAN隧道接口,且接口名称必须与VDS中的VXLAN隧道接口名称一致;如果是,请继续进行下一步。
(3) 检查vSwitch是否配置了VTEP IP地址,如果否,请配置VTEP IP地址;如果是,请继续进行下一步。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
在控制器上无法添加主机,提示“添加主机失败,未找到允许接入vSwitch的Region”。
造成故障的原因可能为Region配置了“禁止vSwitch接入”。
故障处理步骤为:
(1) 登录控制器,单击[控制器/控制器信息],单击“Region”区段的Region名称,在弹出的Region详细信息对话框中查看是否配置了“禁止vSwitch接入”,如果是,请删除并重新配置Region,同时设置“禁止vSwitch接入”为否。如果否,请继续进行下一步。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
在控制器上无法添加主机,提示“OverLay License不可用”。
造成故障的原因可能为OverLay License不可用。
故障处理步骤为:
(1) 检查是否已获取OverLay License授权,如果否,请申请OverLay License并获取授权,详情请参见《H3C VCF控制器安装指导》;如果是,请继续进行下一步。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
在控制器上查看虚拟交换机桥的信息,显示为“配置不可用”。
造成故障的原因可能有如下几种:
· 主机的UPLINK、VMkernel或者TUNNEL这三种类型的端口不全,或者端口没有全部为up状态
· 主机没有获取到对应的VTEP IP地址或者Gateway IP地址
故障解决办法为:
(1) 登录控制器,单击[虚拟网络/计算域],单击“主机”页签,单击“虚拟交换机桥”区段下的“详情”链接,在虚拟交换机桥详情页面查看主机是否有VTEP IP地址和Gateway IP地址,如果有,请继续下一步;如果没有:
· 对于vCenter环境:请在vCenter上为主机的VMkernel口配置VTEP IP地址和Gateway IP地址。
· 对于KVM环境:请在Compute节点上配置VTEP IP地址。
(2) 在虚拟交换机桥详情页面单击“端口”区段的“详情”链接,在该页面查看主机端口的数量和状态是否正确,如果否,请在vCenter(vCenter环境)或Compute节点(KVM环境)上添加对应的端口配置;如果是,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
在主机的命令行界面指定控制器地址为控制器集群IP地址,在控制器上刷新页面后,查看不到该主机相关信息。
造成故障的原因可能有如下几种:
· 集群IP地址不可达。
· OverLay License不可用。
· 控制器已添加对应主机。
· vSwitch网桥名称错误。
· vSwitch未配置VXLAN隧道接口。
· Region配置了“禁止vSwitch接入”。
· VCF控制器南向接口IP地址和vSwitch的管理口IP地址不在同一网段。
故障解决办法为:
(1) 检查主机到集群IP地址是否可达,如果否,请对网络进行排查;如果是,请继续进行下一步。
(2) 检查是否已获取OverLay License授权,如果否,请申请OverLay License并获取授权,详情请参见《H3C VCF控制器安装指导》;如果是,请继续进行下一步。
(3) 检查是否已经通过控制器的GUI界面添加过该主机,如果是,则控制器中的主机的UUID与虚拟机管理平台中的主机的UUID是不一致的,属于非自动部署的主机,需要先在控制器界面上删除主机,然后再自动部署;如果否,请继续进行下一步。
(4) 检查主机是否已经配置了vSwitch网桥,并检查是否与控制器上VDS的网桥名称一致,如果否,请配置vSwitch网桥并保证名称与VDS的网桥名称一致;如果是,请继续进行下一步。
(5) 检查vSwitch是否配置VXLAN隧道接口,要求VXLAN隧道接口名称要与控制器的VDS配置的名称一致,且已配置VTEP IP地址。如果否,请按要求进行配置;如果是,请继续进行下一步。
(6) 登录控制器,单击[控制器/控制器信息],单击“Region”区段的Region名称,在弹出的Region详细信息对话框中查看是否配置了“禁止vSwitch接入”,如果是,请删除并重新配置Region,同时设置“禁止vSwitch接入”为否。如果否,请继续进行下一步。
(7) 检查VCF控制器南向接口IP地址和主机的管理口IP地址是否在同一网段,如果否,请配置为同一网段;如果是,请继续进行下一步。
(8) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
通过虚拟机管理平台无法删除控制器上的主机。
造成故障的原因可能为虚拟机管理平台上主机的UUID与控制器上的UUID不一致。
故障解决办法为:
(1) 检查虚拟机管理平台上的REST资源的地址是否正确配置为控制器集群的IP地址,且集群IP地址必须可达。如果否,请按要求进行配置;如果是,请继续进行下一步。
(2) 检查主机是否是通过控制器的GUI界面添加的。如果是,则控制器自动生成的主机的UUID和虚拟机管理平台上对应主机的UUID是不同的,所以无法删除。请先在控制器界面删除主机,再使用虚拟机管理平台的自动部署功能添加主机;如果否,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
两台虚拟机之间无法互通。
造成故障的原因可能有如下几种:
· 虚拟机上不存在对应的ARP表项,或者表项不正确。
· 虚拟机所在的主机上不存在对应的流表或者流表错误。
· 虚拟机所在的主机间Underlay网络不通。
故障处理步骤如下:
(1) 检查虚拟机相应的虚拟端口和UPLINK接口等状态是否为up,两台虚拟机所在的网络类型是否一致,且虚拟机所在的子网都绑定在同一个虚拟路由器上,如果以上检查均符合要求,则继续进行下一步。
(2) 检查虚拟机里是否存在对应的ARP表项,如果否,则需要保证该两台虚拟机所在的主机均已在控制器上线;如果是,则检查ARP表项是否正确,如果不正确,请删除不正确的ARP表项。如果仍然无法解决,对于两台虚拟机属于同一主机的情况,请按照步骤(5)进行处理;对于两台虚拟机属于不同主机的情况,请继续进行下一步。
(3) 检查两台虚拟机所属的主机是否能够相互Ping通对方的VTEP IP地址,如果否,可能是ARP表项不正确,建议在控制器上删除主机后再添加主机。如果是,请继续进行下一步。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
KVM主机未上线到指定的计算域,而上线到默认的计算域。
造成故障的原因可能为OVSDB未配置KVM类型的计算域。
故障处理步骤如下:
(1) 确认主机是否为手动添加的主机,如果是,请直接进行步骤(4);如果否,请继续进行下一步。
(2) 登录控制器,单击[虚拟网络/计算域],在计算域页面查看是否配置了KVM类型的计算域,如果否,请手动配置KVM类型的计算域;如果是,请继续进行下一步。
(3) 在主机上查看所属的计算域的UUID是否为指定的计算域的UUID,如果是,请继续进行下一步;如果否,请先在VCF控制器上删除主机信息,在主机上重新设置计算域UUID为指定的计算域UUID,然后重新上线主机。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
KVM主机上线后,在控制器上查看不到该主机对应的VXLAN口的端口信息。
造成故障的原因可能为配置主机VXLAN隧道接口时,接口类型配置错误。
故障处理步骤如下:
(1) 在Compute节点上查看VXLAN隧道口的类型是否为VXLAN,如果否,请手动配置为VXLAN类型;如果是,请继续进行下一步。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
KVM主机上线后,在控制器上查看不到该主机对应的UPLINK接口的端口信息。
造成故障的原因可能为VCFC无法识别主机UPLINK接口类型。
故障处理步骤如下:
(1) 缺省情况下,VCFC只能识别“eth”、“em”、“p”、“bond”、“eno”、“ens”六种类型的UPLINK接口,请在Compute节点上查看UPLINK接口类型,是否为上述六种类型之一,如果否,请通过Rest API接口创建对应类型的端口前缀,如果是,请继续进行下一步。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
Underlay网络的主机VTEP IP地址和VSR网关无法互通。
造成故障的原因可能为主机的VTEP IP地址和VSR网关的IP地址属于同一网段。
故障处理步骤如下:
(1) 检查主机VTEP IP地址和VSR网关的IP地址是否处于同一网段,如果否,请继续进行下一步;如果是,请重新配置VTEP IP地址:
· 对于vCenter环境:请在VMkernel口上重新配置VTEP IP地址和VSR网关的IP地址不在同一网段。
· 对于KVM环境:请在Compute节点上重新配置VTEP IP地址和VSR网关的IP地址不在同一网段。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
Underlay网络,主机的VTEP IP地址和TOR网关无法互通。
造成故障的原因可能为主机的默认路由设置错误。
故障处理步骤如下:
(1) 检查主机的默认路由,查看默认路由的下一跳是否为TOR网关IP地址,如果否,请重新设置主机的默认路由;如果是,请继续进行下一步。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
网关型防火墙创建成功后,显示为非Active状态。
造成故障的原因可能为创建网关型防火墙时没有绑定虚拟路由器。
故障处理步骤为:
(1) 检查防火墙是否绑定虚拟路由器。在[网络服务/防火墙]页面查看该防火墙对应的“资源/虚拟路由器”列是否显示为“---”。如果是,请修改防火墙配置,绑定虚拟路由器;如果否,请继续进行下一步。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
网关型防火墙创建成功,状态变为Active,但防火墙并未生效。
造成故障的原因可能有如下几种:
· 虚拟路由器没有绑定外部网络。
· 外部网络没有创建子网。
· 虚拟路由器没有绑定网关。
· 虚拟路由器没有绑定内网子网。
· 网关资源与控制器没有建立OpenFlow连接。
· 网关资源不属于任何一个Region。
故障处理步骤为:
(1) 检查虚拟路由器是否绑定外部网络。进入[虚拟网络/虚拟路由器]页面,查看虚拟路由器对应的“外部网络”列是否显示为“None”。如果是,请创建并绑定外部网络,外部网络可在[虚拟网络/虚拟链路层网络]页面进行创建;如果否,请继续进行下一步。
(2) 检查外部网络是否已创建子网。在[虚拟网络/虚拟链路层网络]页面,单击“子网”列的按钮进入子网配置页面,查看该页面是否存在相应子网。如果否,请创建子网;如果是,请继续进行下一步。
(3) 检查虚拟路由器是否绑定网关。进入[虚拟网络/虚拟路由器]页面,查看虚拟路由器对应的“绑定网关”列是否显示为“false”。如果是,请修改虚拟路由器配置,绑定网关,使得“绑定网关”列状态变为“true”;如果否,请继续进行下一步。
(4) 检查虚拟路由器是否绑定内网子网。进入[虚拟网络/虚拟路由器]页面,点击虚拟路由器对应的“接口”列中的按钮,进入接口配置页面,查看是否有内网信息;如果否,请修改虚拟路由器配置,增加内网信息;如果是,请继续进行下一步。
(5) 检查网关资源与控制器是否建立OpenFlow连接。进入[虚拟网络/租户管理]页面,查找网关型防火墙对应的虚拟路由器绑定的网关资源,然后进入[运维监控/设备信息]页面,检查控制器是否和网关建立OpenFlow连接。如果否,请参见“7.1 控制器与OpenFlow设备无法建立连接”进行处理;如果是,请继续进行下一步。
(6) 进入[首页/概览]页面,单击“控制器”区域中相应的Region图标进入Region详细信息页面,检查网关资源是否属于某个Region。如果否,请检查Region是否已创建。如果Region已创建,请继续进行下一步。
(7) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
服务链型防火墙创建成功后,显示为非Active状态。
造成故障的原因可能有如下几种:
· 创建防火墙时没有绑定vFW资源。
· 该防火墙没有被服务链引用。
故障处理步骤为:
(1) 检查防火墙是否绑定资源。在[网络服务/防火墙]页面查看该防火墙对应的“资源/虚拟路由器”列是否为“---”;如果是,请创建资源,然后修改防火墙配置绑定资源;
(2) 检查服务链是否绑定防火墙。进入[网络服务/服务链]页面,单击按钮查看服务节点列表下是否包含该防火墙,如果否,请修改服务链配置,绑定防火墙。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
服务链型防火墙创建成功,状态变为Active,但防火墙并未生效。
造成故障的原因可能有如下几种:
· 流量特征组的“流量特征列表”为空,或配置不完整。
· vFW资源与控制器没有建立OpenFlow连接。
· vFW资源不属于任何一个Region。
故障处理步骤为:
(1) 检查流量特征组配置。进入[网络服务/服务链/流量特征组]页面,单击指定流量特征组的按钮,查看“流量特征列表”是否为空;如果是,请修改流量特征组配置。如果否,请继续进行下一步。
(2) 进入[虚拟网络/租户管理]页面,单击“服务资源”列中的按钮,查找服务链型防火墙绑定的vFW资源的管理IP地址,然后进入[运维监控/设备信息]页面,检查该管理IP对应的vFW资源是否和控制器建立OpenFlow连接。如果否,请参见“7.1 控制器与OpenFlow设备无法建立连接”进行处理;如果是,请继续进行下一步。
(3) 进入[首页/概览]页面,单击“控制器”区域中相应的Region图标进入Region详细信息页面,检查vFW资源是否属于某个Region。如果否,请检查Region是否已创建。如果Region已创建,请继续进行下一步。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
防火墙引用或修改策略及规则后,该策略或规则并未生效。
造成故障的原因可能有如下几种:
· 创建或修改策略时未勾选“已审计”复选框。
· 创建或修改规则时未勾选“激活”复选框。
故障处理步骤为:
(1) 检查指定策略配置是否已勾选“已审计”。进入[网络服务/防火墙]页面,单击[策略]页签,查看该策略的“已审计”列是否显示为“False”;如果是,请修改策略配置,勾选“已审计”复选框。
(2) 检查指定规则配置是否已勾选“激活”。单击[规则]页签,查看该规则的“激活状态”列是否显示为“False”;如果是,请修改规则配置,勾选“激活”复选框。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
防火墙生效且流量正常转发,但设备并未生成会话或统计信息。
造成故障的原因可能为流量的源、目的IP地址和规则中定义的源目的IP地址不一致。
故障处理步骤为:
(1) 查看防火墙所引用规则中指定的源、目的IP地址与相应流量的源、目的IP地址是否一致。如不一致,请修改规则中的源、目的IP地址。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
网关型负载均衡器创建成功后,显示为非Active状态。
造成故障的原因可能有如下几种:
· 负载均衡器没用引用实服务器组。
· 负载均衡器引用的实服务器组没有绑定子网。
· 子网没有被添加到虚拟路由器。
故障处理步骤为:
(1) 检查负载均衡器是否已引用实服务器组。进入[网络服务/负载均衡]页面,查看指定负载均衡器的“实服务器组”是否显示已绑定相应的实服务器组。如果否,请通过修改负载均衡器配置引用实服务器组;如果是,请继续进行下一步。
(2) 检查负载均衡器引用的实服务器组是否绑定虚拟子网。进入[网络服务/负载均衡]页面,单击[实服务器组]页签进入实服务器组配置页面。在该页面单击指定实服务器组对应“操作”列的按钮,在进入的详细信息页面查看子网是否已绑定。如果否,请修改实服务器组配置绑定子网;如果是,请继续进行下一步。
(3) 检查实服务器组绑定的子网是否已添加到虚拟路由器。进入[虚拟网络/虚拟路由器]页面,单击“接口”列中的按钮,查看相应子网是否已添加到虚拟路由器。如果否,请将该子网添加到虚拟路由器中;如果是,请继续进行下一步。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
实服务器组创建成功后,显示为非Active状态。
造成故障的原因可能有如下几种:
· 实服务器组没有被任何负载均衡器引用。
· 引用该实服务器组的负载均衡器处于非Active状态。
故障处理步骤为:
(1) 进入[网络服务/负载均衡]页面,查看该实服务器组是否已被某个负载均衡器引用。如果否,请选择负载均衡器引用该实服务器组;如果是,请继续进行下一步。
(2) 检查引用该实服务器组的负载均衡器状态是否为Active。如果否,请参见“14.1 网关型负载均衡器状态不是Active”进行处理;如果是,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
虚服务器创建成功后,显示为非Active状态。
造成故障的原因可能有如下几种:
· 虚服务器没有关联实服务器组。
· 虚服务器关联的实服务器组状态不是Active。
· 虚服务器地址不在实服务器组绑定的虚拟子网网段内。
· 虚拟子网没有被添加到虚拟路由器。
· 虚拟路由器没有绑定网关。
· 虚拟路由器没有配置外部网络。
故障解决办法为:
(1) 检查虚服务器是否关联实服务器组。进入[网络服务/负载均衡]页面,单击[虚服务器]页签,查看指定虚服务器的“实服务器组”列是否已关联实服务器组。如果否,请通过修改虚服务器配置关联实服务器组;如果是,请继续进行下一步。
(2) 单击[实服务器组]页签,在该页面检查虚服务器关联的实服务器组状态是否为Active。如果否,请参见“14.2 实服务器组状态不是Active”进行处理;如果是,请继续进行下一步。
(3) 检查虚服务器地址是否在实服务器组绑定的虚拟子网网段内。虚拟子网网段可以通过实服务器组的详细信息页面查看。如果否,请修改虚服务器的IP地址;如果是,请继续进行下一步。
(4) 检查实服务器组绑定的虚拟子网是否已添加到虚拟路由器。进入[虚拟网络/虚拟路由器]页面,单击“接口”列中的按钮,查看相应子网是否已添加到虚拟路由器。如果否,请选择一个虚拟路由器接入到虚拟子网;如果是,请继续进行下一步。
(5) 检查虚拟路由器是否绑定网关。进入[虚拟网络/虚拟路由器]页面,查看指定虚拟路由器的“绑定网关”列是否显示为“true”,如果否,请绑定网关;如果是,请继续进行下一步。
(6) 检查虚拟路由器是否配置外部网络。进入[虚拟网络/虚拟路由器]页面,查看指定虚拟路由器的“外部网络”列是否显示为“None”。如果是,请绑定外部网络,如果否,请继续进行下一步。
(7) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
在[网络服务/负载均衡/成员]页面增加成员时,成员列表为空。
造成故障的原因可能有如下几种:
· 选择的实服务器组没有绑定虚拟子网。
· 虚拟子网下没有vSwitch类型的虚拟端口。
故障解决办法为:
(1) 检查选择的实服务器组是否绑定虚拟子网。进入[网络服务/负载均衡]页面,单击[实服务器组]页签,在该页面单击指定实服务器组对应“操作”列的按钮,在实服务器组详细信息页面查看虚拟子网是否已绑定。如果否,请通过修改实服务器组配置绑定虚拟子网;如果是,请继续进行下一步。
(2) 进入[虚拟网络/虚拟端口]页面,检查虚拟子网下是否有类型为vSwitch的虚拟端口,如果否,请配置vSwitch虚拟端口上线;如果是,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
成员创建成功后,显示为非Active状态。
造成故障的原因可能有如下几种:
· 成员没有关联实服务器组。
· 成员关联的实服务器组状态不是Active。
故障解决办法为:
(1) 检查成员是否关联实服务器组。进入[网络服务/负载均衡]页面,单击[成员]页签,查看指定成员对应的“实服务器组”列是否已关联实服务器组。如果否,请通过修改成员配置关联实服务器组;如果是,请继续进行下一步。
(2) 单击[实服务器组]页签,检查成员关联的实服务器组状态是否为Active。如果否,请参见“14.2 实服务器组状态不是Active”进行处理;如果是,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
健康检测创建成功后,显示为非Active状态。
造成故障的原因可能有如下几种:
· 健康检测没有被任何实服务器组引用。
· 引用健康检测的实服务器组状态不是Active。
故障解决办法为:
(1) 检查是否有实服务器组引用该健康检测。进入[网络服务/负载均衡]页面,单击[实服务器组]页签,查看“健康检测方法”列检查指定健康检测是否被引用。如果否,请选择一个实服务器组引用该健康检测;如果是,请继续进行下一步。
(2) 检查引用健康检测的实服务器组状态是否为Active。如果否,请参见“14.2 实服务器组状态不是Active”进行处理;如果是,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
网关型负载均衡器状态为Active,但功能未生效。
造成故障的原因可能有如下几种:
· 控制器没有和网关资源建立OpenFlow连接。
· 网关资源不属于任何一个Region。
故障解决办法为:
(1) 进入[虚拟网络/租户管理]页面,查找网关型负载均衡器对应的虚拟路由器绑定的网关资源,然后进入[运维监控/设备信息]页面,检查控制器是否和网关资源建立OpenFlow连接。如果否,请参见“7.1 控制器与OpenFlow设备无法建立连接”进行处理;如果是,请继续进行下一步。
(2) 进入[首页/概览]页面,单击“控制器”区域中相应的Region图标进入Region详细信息页面,检查网关是否属于某个Region。如果否,请检查Region是否已创建。如果Region已创建,请继续进行下一步。
(3) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
服务链创建成功后,显示为非Active状态。
故障解决办法为:
(1) 检查服务链上的所有服务实例是否已全部绑定资源,如果否,请修改服务实例配置,绑定资源。
(2) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
服务链处于Active状态,但功能并未生效。
造成故障的原因可能有如下几种:
· 服务链指定的源和目的特征组与流量的源和目的特征不匹配。
· 服务链上的服务实例无法正常工作。
· 服务链路径上设备的流表不正确。
故障解决办法为:
(1) 检查服务链指定的源和目的流量特征组是否与流量的源和目的特征匹配。如果否,请修改服务链的源和目的流量特征组;如果是,请继续进行下一步。
(2) 检查服务链上的服务实例是否正常工作。如果否,请参见相应服务实例的故障处理部分;如果是,请继续进行下一步。
(3) 检查服务链路径上各个设备的流表信息是否正常。如果否,请参见“7.4 控制器无法下发流表项”进行处理;如果是,请继续进行下一步。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
主机上线后,无法下发主机策略流表。
造成故障的原因可能有如下几种:
· 与主机连接的OpenFlow设备没有与控制器建立OpenFlow连接。
· 未加载ARP APP。
· 加载了与安全策略冲突的APP,如:承载网络和虚拟网络。
· 网络设备上OpenFlow实例的流表项数量和Meter表项数量达到了设备规格。
故障解决办法为:
(1) 检查与主机连接的OpenFlow设备与控制器是否已建立了OpenFlow连接。如果否,请参见“7.1 控制器与OpenFlow设备无法建立连接”进行处理;如果是,请继续进行下一步。
(2) 检查是否已加载ARP APP。如果否,请加载ARP APP;如果是,请继续进行下一步。
(3) 检查是否已卸载承载网络和虚拟网络。如果否,请卸载;如果是,请继续进行下一步。
(4) 检查用户组及策略是否配置正确。如果否,请按需求进行配置;如果是,请继续进行下一步。
(5) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
OpenFlow设备之间的网络接口处于up状态,但无法给设备下发流表(网络接口流表保证了网络接口上所有能触发主机学习的报文都不会上送控制器)。
造成故障的原因可能有如下几种:
· 与主机连接的OpenFlow设备没有与控制器建立OpenFlow连接。
· OpenFlow设备没有使能LLDP。
· [控制器/系统管理/配置管理/链路管理]配置项中的learn.multihop.links没有设置为true。
· [控制器/系统管理/配置管理/链路管理]配置项中的timeout.links没有设置为true。
故障解决办法为:
(1) 检查与主机连接的OpenFlow设备与控制器是否已建立OpenFlow连接 ,如果否,请参见“7.1 控制器与OpenFlow设备无法建立连接”进行处理,如果是,请继续进行下一步。
(2) 检查OpenFlow设备的组网配置是否正确,如果否,请按需求进行配置;如果是,请继续进行下一步。
(3) 检查链路管理配置项中的learn.multihop.links是否设置为true(单击[控制器/系统管理/配置管理]菜单项可进入配置管理页面),如果否,请设置为true;如果是,请继续进行下一步。
(4) 检查链路管理配置项中的 timeout.links是否设置为true(单击[控制器/系统管理/配置管理]菜单项可进入配置管理页面),如果否,请设置为true;如果是,请继续进行下一步。
(5) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
网络设备启动后,无法从DHCP服务器分配到IP地址。
(1) 请确保网络设备和控制器之间网络可达。
(2) 请确保已成功加载ZTP APP,并已成功激活ZTP License。
(3) 请确保已配置指定网络设备对应的部署信息。
(4) 请确保配置的部署信息已应用生效。
(5) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
网络设备分配到IP地址后,无法获取到指定的配置文件。
(1) 请确保网络设备和配置文件服务器之间网络可达。
(2) 配置为本地文件服务器时,查看部署信息,确定指定网络设备的配置文件是否存在,如果不存在,请上传配置文件。
(3) 配置为第三方文件服务器时,请确保服务已经开启,且配置文件已经存在。
(4) 如果上述操作完成后故障仍无法排除,请联系H3C技术支持工程师。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!