整本手册
本章节下载 (2.36 MB)
H3C S1010V虚拟交换机故障处理手册
Copyright © 2013 杭州华三通信技术有限公司 版权所有,保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部, 并不得以任何形式传播。本文档中的信息可能变动,恕不另行通知。 |
|
目 录
4.3 在S1010V配置页签中配置任何业务功能弹出重新上传License提示
4.4 部属完VCE之后,使用S1010V产品提示“License错误,检测到VCE虚拟机的位置被改变.”
4.5 批量安装VFE时,弹出的提示信息出现在所有窗口的最底层导致界面处于无响应状态
4.6 ESXi主机CPU数量变化造成VFE授权状态显示异常
4.7 VCE迁移到其它群集下的ESXi主机后无法进行产品注册
6.2 全局配置页面中vCenter Server连接信息无法配置
6.5 全局配置页面中无法删除vCenter Server连接信息
6.6 在全局页面上更改管理主机的vCenter服务器IP时,出现获取MAC地址错误
6.7 重新安装vCenter Server后,在全局配置页面中连接vCenter Server失败
8.5 vSphere Client页面中显示的VDS不是由当前VCE创建的VDS
9.5 插件VDS页面DVPortGroup和UplinkPortGroup个数不能自动刷新
9.8 特定情况下,在VMware vSphere Client中可以随意删除端口组
10.1 虚拟机的vNIC绑定了VDS的端口组,但是虚拟机间无法通信
10.2 重启VCE服务并在VDS中移除vNIC,有关于广播流量的流表残留
11.1 重启物理交换机上的EVB端口后,VSI接口无法正常上线
H3C S1010V虚拟交换机的操作界面与产品的版本有关,您所使用的产品界面可能与本文中的介绍存在少量差异,请以您实际使用的版本为准。
H3C S1010V虚拟交换机由三部分组成:VCE(Virtual Control Engine,虚拟控制引擎)、VFE(Virtual Forwarding Engine,虚拟转发引擎)、VMware插件。关于这三部分的详细介绍,请参见《H3C S1010V虚拟交换机 安装指导》。
在对H3C S1010V进行故障定位与排除时,首先需要确定可能产生故障的组件,是VCE、VFE还是VMware插件;然后在可能发生故障的组件上收集故障定位信息,对故障进行逐步排除。
了解与H3C S1010V虚拟交换机共同配合使用的其它产品,有助于帮助您掌握S1010V的功能实现流程,从而能够更快速和准确的定位故障原因。
H3C智能管理中心(intelligence Management Center,iMC)平台(以下简称iMC平台)为用户提供了实用、易用的网络管理功能,在网络资源的集中管理基础上,实现拓扑、故障、性能、配置、安全等管理功能。除了提供丰富的功能,iMC更通过流程向导的方式告诉用户如何使用功能满足业务需求,为用户提供了网络精细化管理最佳的工具软件。
图1 iMC与S1010V虚拟交换机的关系
H3C S1010V虚拟交换机在使用时,必须与一台iMC服务器相连,以实现虚拟连接管理和网络策略下发。如果没有连接iMC服务器,或iMC服务器的IP地址、端口号、用户名或密码填写错误,将无法在H3C S1010V虚拟交换机的VMware插件中配置VDP信息,H3C S1010V虚拟交换机所连接的虚拟机的VSI也无法上线。
EVB交换机是H3C虚拟交换EVB解决方案中的重要组成部分,又称为ToR(Top of Rack)交换机。目前支持作为EVB交换机的有H3C S5820V2系列和S5830V2系列交换机。H3C S1010V虚拟交换机所在的服务器必须连接到一台EVB交换机,同时EVB交换机上与服务器相连的物理接口或聚合口必须使能EVB,才能正确实现EVB功能。
EVB交换机的配置请参考H3C S5820V2&S5830V2交换机的配置手册。
当出现问题时,请按以下通用步骤进行问题定位:
(1) 收集一切与故障现象有关的H3C S1010V虚拟交换机信息。例如:插件中显示的配置信息、VCE及VFE的日志信息、当前网络中的流量信息、VSI的上下线信息等等。
(2) 收集一切与故障现象有关的iMC和H3C S5820V2/S5830V2交换机信息。
(3) 分析收集到的信息,并根据分析结果定位出可能产生故障现象的潜在问题(可能不止一个)。
(4) 对定位出的各个潜在问题,根据其与故障现象的相关性,逐一进行排除,直到故障现象消失为止。
为了使您的网络系统正常、良好地运行,我们向您提出以下建议:
· 请保证整个网络系统中部署的H3C S1010V虚拟交换机,包括VCE和VFE都使用了相同的版本。
· 请参考H3C S1010V虚拟交换机的发布版本的版本说明书,以获取最新的特性、限制及警告。
· 在进行任何配置前,请确认您能够了解该操作对网络产生的作用和影响;在进行了任何配置更改后,请及时对修改后的配置进行验证。
在进一步定位某个功能模块的具体问题之前,请首先确认如下问题:
· 当前的S1010V是新部署的系统,还是已经运行了一段时间的系统。
· 安装H3C S1010V的服务器主机是否正确连接到了网络中。
· 当前正在解决的是已存在的系统性能问题(速度慢、高延迟、超长响应时间等)还是最新出现的问题。
· 在问题出现之前,在整个系统中,进行了哪些配置的变更。
在出现故障后,请您收集以下几类信息,以便更准确的定位问题。
· S1010V产品信息,包括:
¡ 产品版本
¡ 日志信息
· 与S1010V配合的其它产品的信息,包括:
¡ iMC产品的版本
¡ ToR交换机的型号和所使用的软件版本及其全部的配置信息
¡ VMware的vCenter Server、vShpere Client及ESXi的具体版本信息
¡ 服务器的型号和硬件配置信息
请确认以下几点以保证服务器的网卡正常工作:
· 网卡是否连接了正确的介质,是铜缆还是光纤,以及光纤的类型。
· 网卡所连接的介质是否完好。
· 通过服务器的控制台或者上游交换机查看网卡是否运行良好。
请确认以下几点以保证网络的二层连通性:
· 所有需要在二层通信的端口是否在同一个VLAN中。
· 服务器侧和ToR交换机侧端口的聚合配置是否一致。
关于聚合配置的检查,请见1.4.9 检查端口聚合配置是否正确一节。
请确认以下几点以保证网络的三层连通性:
· 需要三层互通的各设备是否配置了正确的IP地址并且相互之间有正确的路由信息。
· 在ToR交换机侧,是否有任何防火墙或QoS的配置限制了服务器的IP地址。
可使用ping或tracert命令来验证三层连通性。
H3C S1010V的VCE注册在vCenter Server上,必须依赖vCenter Server才能运行,在VCE上创建的VDS、端口组等也会保存到vCenter Server中。如果H3C S1010V没有与vCenter Server连接,将会产生一些问题。在H3C S1010V开始使用之前,请通过全局配置页面来确认已经连接上vCenter Server。在全局配置页面的vCenter服务器状态栏中,连接选项一列如果显示图标,表示vCenter Server已正常连接,如果显示
,则说明vCenter Server已经断开。
在全局配置页面,可以查看iMC服务器的配置信息。
图2 iMC服务器配置
如上图所示,表示已经配置了iMC服务器。需要注意的是,在部署VCE的过程中填写iMC服务器的参数时,或者在全局配置页面配置iMC服务器的参数时,不会对各项参数的有效性进行校验。H3C S1010V在运行时会根据这些参数对iMC服务器进行连接,如果配置有误,则会出现问题。请在配置iMC服务器的参数(包括IP地址、端口号、用户名、密码)时,保证和网络中所部署的iMC服务器的实际参数相一致。
请在全局配置页面查看插件是否安装成功。
图3 插件安装信息
如上图所示,插件选项一列显示了插件的安装状态。显示时,表示插件已安装。显示
时,表示插件已卸载,请点击“安装”按钮安装插件。
请首先确认服务器上与ToR交换机相连接的物理网卡,以及ToR交换机上与服务器相连接的端口。目前H3C S1010V的链路聚合模式为静态聚合,聚合成员端口的运行方式为负载分担方式,负载分担类型可以选择源MAC地址或目的MAC地址。在配置时,请确保所有的聚合成员口务必为同一类型、同一速率,且服务器侧和ToR交换机侧相对应的端口同时配置了聚合。
在服务器侧,请在vSphere Client中打开S1010V的链路聚合配置页面,检查服务器端口的聚合配置情况。
图4 链路聚合配置页面
如上图所示,表示将服务器上vmnic2和vmnic3两个物理端口进行聚合,在物理端口名称之前勾选表示选中此端口。
在ToR交换机侧,请使用如下命令检查聚合接口配置:
在系统视图下,执行display link-aggregation verbose命令查看聚合口的配置。
<Sysname> display link-aggregation verbose
Loadsharing Type: Shar -- Loadsharing, NonS -- Non-Loadsharing
Port Status: S -- Selected, U -- Unselected
Flags: A -- LACP_Activity, B -- LACP_Timeout, C -- Aggregation,
D -- Synchronization, E -- Collecting, F -- Distributing,
G -- Defaulted, H -- Expired
Aggregate Interface: Bridge-Aggregation100
Aggregation Mode: Static
Loadsharing Type: Shar
Port Status Priority Oper-Key
--------------------------------------------------------------------------------
XGE1/0/15 S 32768 4
XGE1/0/29 S 32768 4
其中,XGE1/0/15和XGE1/0/29为与服务器的vmnic2和vminc3相连接的端口,其中状态为S的端口表示选中的端口,请保证与服务器相连的所有端口同时处于选中状态。
如果使用本手册中介绍的故障排除方式无法解决您的问题,您可以联系H3C技术支持人员寻求进一步的帮助。详见联系支持一章。
在浏览器中输入http://VCEIP:8090,可以进入H3C S1010V的用户登录页面,输入用户名admin,密码admin进入全局配置页面,在全局配置页面中可查看和修改iMC服务器和vCenter Server服务器的配置。
图5 VCE全局配置页面
操作日志记录了用户所进行的操作,包括操作时间,操作内容和操作结果等。在定位与排除故障时,通过操作日志可以方便地查看故障发生之前对系统所做的更改,以及操作的结果是成功还是失败。
在VCE的全局配置页面上,点击导航栏中“操作日志”项便可以查看操作日志。
图6 选择操作日志
H3C S1010V虚拟交换机基于Ubuntu系统运行,关于在控制台下进行文件夹和文件操作的方法,请参见Ubuntu系统的配置手册。
打开VCE虚拟机的控制台,进入目录/var/log/floodlight,可看到VCE的log信息。
通过SSH客户端登入ESXi主机,进入目录/var/log,可查看VFE的log信息。
另外还可通过系统管理页面中的日志收集功能收集系统log。
H3C S1010V虚拟交换机在VFE上提供了一系列维护命令,用于故障定位与排除:
· dpctl dump-flows
· dpctl dump-ports
· dpctl dump-tables
· dpctl show
关于这些命令的用法,请参见S1010V产品联机帮助中的“系统维护>VFE维护”部分。
在安装VCE之前,请提前规划好VCE的IP地址,以免和网络中其他设备的IP地址产生冲突。
完成VCE的安装部署后,在启动虚拟机时提示“必须配置属性‘XXX’,虚拟机才能打开电源。”,如图7所示。
出现此错误提示是由于在安装过程中填写部署信息时某些项没有填写造成的,可在虚拟机设置里补充填写来解决。
(1) 在vSphere Client中,右键点击VCE虚拟机后,点击“编辑设置”。
(2) 在弹出页面点击“选项”页签,点击“属性”,如图8所示。
(3) 在右侧窗口将信息填写完整后,点击“确定”关闭页面,再打开虚拟机电源即可。
VCE启动后,用户第一次进行产品注册,在上传License文件时弹出错误信息“MAC地址校验不通过,请重新上传License文件。”
请按如下步骤操作:
(1) 登录到VCE全局配置页面,检查VCE与vCenter Server是否已正确连接。如当前没有连接(连接选项处显示图标),点击“连接”将VCE连接至vCenter Server。连接完成后在连接选项处应显示
图标,如图9所示:
图9 vCenter Server连接正确示意图
(2) 重新上传License文件。如仍存在上述问题,则表示正式License文件信息不正确。
(3) 重新下载主机文件后,获取新的正式License文件,重新上传。
VCE启动后,用户第一次产品注册下载主机文件时弹出提示信息“vCenter Server配置错误,请登录全局配置页面进行配置。”
请按如下步骤操作:
(1) 请检查当前配置的vCenter Server是否可以管理VCE所在的虚拟机,如果当前配置的vCenter Server与管理VCE虚拟机的vCenter Server不同,请在全局配置页面下卸载插件并断开vCenter Server连接后,删除现有的vCenter Server,重新设置可以管理VCE所在虚拟机的vCenter Server,并在安装插件后进行连接。
(2) 如果确认vCenter Server的设置正确,请登录到VCE全局配置页面,检查VCE与vCenter Server是否已正确连接。如当前没有连接(连接选项处显示图标),点击“连接”将VCE连接至vCenter Server。连接完成后在连接选项处应显示
图标,如图10所示:
图10 vCenter连接正确示意图
(3) 重新下载主机文件
VCE启动后,用户已上传正式License文件并注册成功。在配置页签中刷新Port Group页面,弹出错误信息“MAC地址校验不通过,请重新上传License文件。”
请按如下步骤操作:
(1) 通过Web登录到VCE全局配置页面,检查VCE与vCenter是否已正确连接。如当前没有连接(连接选项处显示图标),点击“连接”将VCE连接至vCenter Server。连接完成后在连接选项处应显示
图标,如图11所示:
图11 vCenter连接正确示意图
(2) 重新刷新配置页面。
部属完VCE虚拟机之后,在使用S1010V产品时,出现错误对话框“License错误,检测到VCE虚拟机的位置被改变”,重启VCE虚拟机仍不可用。
在用户的vCenter Service上该VCE IP地址已经被使用,如果之前使用该IP地址的虚拟机已经处于PowerOff状态,可能是该vCenter Service上之前已经管理过该IP地址的虚拟机,且有缓存存在于该vCenter Service上处于PowerOn状态,需要将断开连接的该虚拟机所在的主机从该vCenter Service上移除。
建议用户部属VCE虚拟机时,使用的IP地址在该vCenter Service上的其他虚拟机上没有使用。
(1) 选择多台安装VFE的ESXi主机,这些主机上的CPU数量超出License管理的个数。
(2) 点击安装后,切换至其它界面。
(3) 当安装CPU的个数超过License可管理的个数时,提示信息出现在所有窗口的最底层。
(4) 再次回到安装VFE的页面,显示页面一直处于刷新状态,无法看见提示信息。
在进行VFE的批量安装/卸载时,不建议切换窗口到其他页面,如果这样操作导致上述错误,将其他窗口最小化并关闭提示信息即可。
主机上安装的VFE已经获取License授权后,扩容该主机的CPU个数,造成已授权主机的CPU之和超过了License授权CPU数,扩容CPU主机上VFE的授权状态将显示告警图标,用鼠标点击告警,显示“CPU数量超过License限制。”
移除扩容的CPU,使授权状态恢复正常。
请不要随意扩容已授权主机的CPU个数。如想扩容请先回收License CPU授权,主机CPU扩容完成后,获得足够的License后再进行授权。
将VCE虚拟机通过vMotion功能迁移到位于其它群集下的ESXi主机后,在点击产品注册时,将会重新启动License注册的流程,导致已注册的License文件中的MAC地址与当前主机中不匹配,因而无法通过License校验,用户将无法使用VCE。系统将自动输出提示信息,提示“License错误,请重新上传License文件”。
VCE虚拟机迁移到其它ESXi主机后,请用户不要点击产品注册。
如果点击了产品注册导致注册失败,无法使用VCE,请按以下步骤处理:
(1) 将VCE迁移回原主机。
(2) 点击产品注册,确认注册完成。
(3) 再次迁移到目的主机,迁移完成后,请不要再点击产品注册按钮。
将主机添加到VDS中后,在VFE配置页面刷新后查看其VDS信息,主机的VDS列显示为“处理中”,如图12所示。
图12 VDS显示异常
这是由于添加主机事件上报到后台程序后的处理过程需要一定的时间,等待几秒后再次刷新就能显示出VDS的名称了。
如果由于一些异常操作,导致VFE没有正常删除,可能导致ESXi异常,如无法转发等,此时需要按照下面方法进行清理。
(1) 使用VMware ESXi命令
请执行参考命令中内核态、用户态(注意顺序)的查看命令,然后使用删除命令删除所有Helium相关vDS(有DvsPortset-0之类非自己手工创建的可以不理),再重启设备,执行上述步骤:
内核态命令:
· 查看当前vswitch
net-dvs
· 删除当前vswitch相关配置
net-dvs –Y switchname
net-dvs –D –p 3 switchname
net-dvs –D –p 2 switchname
net-dvs –D –p 1 switchname
net-dvs –D –p 0 switchname
net-dvs –d switchname
用户态命令
· 查看当前vswitch
esxcfg-vswitch –l
· 删除当前vswitch相关配置
esxcfg-vswitch –d switchname
以vCenter中管理主机192.168.100.153为例,描述该故障。
查看License授权信息有该主机(192.168.100.153)的CPU信息,如下所示:
图13 授权状态
用户刷新页面显示如下,主机192.168.100.153无法使用,状态为未安装且已授权。
图14 授权状态显示异常
以vCenter中管理主机192.168.100.153为例,描述该故障的解决方案。
检查用户是否手动卸载VFE,显示以上故障属于用户未使用S1010V的配置页签,而是自己手动卸载VFE导致。
(1) 选中该主机,点击页面“卸载“按钮,处理完成后,结果如下:
(2) 查看License授权信息中没有该主机(192.168.100.152)的CPU信息,如下图所示:
(3) 在VFE页面上重新选中主机(192.168.100.153),点击“安装“,进行VFE的重新安装。安装完成之后,显示如下,表示该主机已重新安装VFE成功且可使用。
(4) 查看License授权信息有该主机(192.168.100.153)的CPU信息,如下图所示:
(1) 选中该主机,点击页面“安装”按钮,处理完成后,结果如下:
(2) 查看License授权信息有该主机(192.168.100.152)的CPU信息不变,如下所示,该主机已重新安装VFE成功且可使用。
在一个VCE对应的vCenter Server上将某一台ESXi主机绑定到一个VDS上,此后在保持绑定的情况下将ESXi主机直接加入另外一个VCE对应的vCenter Server,再使用原始VCE的界面进行VFE卸载时弹出错误提示“卸载VFE出现错误。”。
当主机未授权时如果卸载VFE失败,可能是该VFE所在的ESXi主机加入了另一个VCE的VDS中,将该主机从VDS中移除后重试即可。
当ESXi主机已经从VDS中移除,且没有再加入任何VDS时,在卸载主机上的VFE时提示“卸载VFE出现错误。”。
出现此问题时无需特殊处理。请等待一段时间(大约1小时)后重新尝试卸载VFE操作,或者重启ESXi主机,然后尝试卸载VFE。
VCE虚拟机重启后,通过浏览器访问全局配置页面,VCE IP、iMC信息和vCenter Server信息无法显示。通过vSphere Client登录vCenter Server后,H3C S1010V的VDS页签和Port Group页签中无信息显示。
产生该问题的原因为:在系统异常关机时没有正常关闭Postgres进程,该进程的文件没有从系统中删除,导致Postgres再次启动时系统分配的进程号与其它进程冲突,最终使Postgres进程无法启动。出现该问题后,请按照如下步骤操作:
(1) 通过控制台或SSH方式访问VCE虚拟机,通过ps aux | grep postgres命令查看Postgres进程是否启动。
(2) 如果Postgres没有启动,进入/opt/postgres/9.2/data目录下,查看该路径下是否有postmaster.pid文件。
(3) 如果存在该文件,删除postmaster.pid文件。
(4) 重启VCE虚拟机。
在全局配置页面试图对vCenter Server的连接信息进行编辑时,出现错误提示“请先配置VCE控制器信息。”。
由于VCE需要通过自身设置的IP地址来连接vCenter Server,因此,在连接vCenter Server之前,必须完成VCE的IP地址设置。请按如下步骤操作:
(1) 在全局配置页面中添加VCE配置。
(2) 在全局配置页面中编辑vCenter Server配置。
在VCE全局配置页面中点击“安装”进行插件注册操作时,出现错误提示“请先连接vCenter Server。”。
在向vCenter Server安装插件时,VCE上必须已经设置了vCenter Server的连接参数并成功连接到vCenter Server。请按如下步骤操作:
(1) 确认全局配置页面中的vCenter Server连接配置正确。
(2) 点击“连接”,将VCE与vCenter Server进行连接,连接完成后应显示图标。
(3) 点击“安装”完成插件安装。插件安装成功后应显示图标。
在VCE全局配置页面中点击“卸载”进行卸载插件操作时,出现错误提示“请先连接vCenter Server。”。
在从vCenter Server上卸载插件时,VCE必须已成功连接到vCenter Server。请按如下步骤操作:
(1) 点击“连接”,将VCE与vCenter Server进行连接,连接完成后应显示图标。
(2) 点击“安装”完成插件安装。插件安装成功后应显示图标。
在VCE全局配置页面中删除已存在的vCenter连接信息时,出现错误提示“vCenter Server处于连接状态,不允许删除。”。
在删除vCenter Server连接信息之前,必须已断开VCE与vCenter Server之间的连接。请按如下步骤操作:
(1) 点击“断开”,断开VCE与vCenter Server之间的连接,断开连接后应显示图标。
(2) 点击vCenter Server连接信息对应的图标,删除vCenter Server连接信息。
用户在全局配置页面上更改了vCenter Server的IP地址,然后重新连接vCenter Server,在S1010V配置页签下操作时会出现错误提示“主机MAC地址获取失败。”。
问题原因在于VCE所在的ESXi主机不在更改后的vCenter Server管理范围内,因此获取不到VCE所在ESXi主机的位置。请按如下步骤操作:
(1) 将安装VCE的ESXi主机加入到更改后的vCenter Server中管理。
(2) 在全局配置页面断开vCenter连接,再建立连接。
在VCE全局配置页面中保留vCenter Server信息的情况下,重新安装vCenter Server,并确保使用与之前相同的IP地址、用户名、密码等配置。完成安装后,在VCE全局配置页面下试图连接vCenter Server时,出现错误提示“连接vCenter Server错误,请检查vCenter Server配置。”。
出现此问题的原因是在没有清除VCE中vCenter Server信息的情况下,直接重装vCenter Server,会导致VCE与vCenter Server上部分数据不一致,从而连接失败。解决此问题需要清除VCE的配置,恢复为出厂配置。请打开VCE虚拟机的控制台,进行以下操作:
(1) 执行命令:cd/opt/h3c
(2) 执行命令:./recovery.sh
(3) 执行命令:reboot
(4) 待VCE重启完成后,在全局配置页面添加vCenter Server的连接信息并再次进行连接。
在vSphere Client中,找不到插件。
· 首先按照1.4.8检查插件是否注册成功确认是否已成功安装了插件。
· 如果插件仍然无法显示,请重启VMware vSphere Client。
· 如果插件仍然无法显示,请在VMware vSphere Client中,选择“插件->管理插件”,右键点击S1010V的插件,并选择“启用”。
图15 插件管理
在S1010V配置页签中配置VDS或端口组的时候,出现如图16的错误提示:
图16 S1010V功能配置页签无法正常显示
(1) 请确认VCE虚拟机已启动并正常工作,可通过登录VCE全局配置界面进行检验。
(2) 在vSphere Client界面中,选择“插件->插件管理”(如图17所示),查看S1010V的插件是否已正确启用,如未启用,请右键选择该插件,并选择“启用”来启用该插件。
图17 vSphere Client插件管理界面
(3) 请检查Internet选项中是否设置了代理服务器,如果是,请取消勾选使用代理服务器后重试。
图18 Internet选项界面
VCE安装完成之后,在VMware vSphere Client中,插件显示异常,且插件名称显示为null。
图19 插件名称显示为null
出现这种情况的原因为,在这台主机上曾经部署过VCE,然后在没有卸载插件的情况下,直接将VCE从主机上删除,后续重新部署VCE时,使用了与被删除VCE相同的IP地址。而VCE的IP地址是作为插件关键字保存在vCenter Server中的,由于vCenter Server中已经存在了相同的插件关键字,导致新安装的VCE安装插件出现异常。
在处理时,需只用vSphere提供的对象管理工具手工删除残留的插件信息。
(1) 使用浏览器输入https://VC-IPaddress/mob,其中VC-IPaddress为vCenter Server的IP地址。将会弹出用户验证框。
(2) 输入vCenter Server的用户名和密码,会进入vSphere对象管理浏览器的服务实例页面。
(3) 在上述页面中的属性列表中,点击“content”。进入服务内容页面。
(4) 在上述页面的属性列表页面中,点击“ExtensionManager”。进入扩展管理页面。并找到残留的插件关键字。插件关键字的形式为“H3C-VCEIP”。
(5) 点击“Methods”栏中的“UnregisterExtension”。
(6) 在弹出的窗口中,在参数的value输入框中,输入残留的插件关键字。并点击“Invoke Method”。
(7) 执行成功后,将会显示出执行结果。
(8) 关闭弹出窗口,查看扩展管理页面,残留的VCE插件关键字已被删除。
(9) 在全局页面上重新安装插件,并重启vShpere Client,插件即可正常显示。
在vSphere Client中,单击数据中心,在页面右侧选择S1010V插件页签,出现如下内容,不能再进入VDS管理页面。
图20 错误提示
出现此现象的主要原因是在创建VDS时使用的数据中心已经被删除,在创建新的数据中心后,进入VDS页面,就会出现如上文所述的错误提示。
(1) 出现此故障后,请通过vSphere Client的控制台登录VCE虚拟机,进入命令行界面,按照以下步骤清除VCE设置,恢复为出厂设置:
cd /opt/h3c
./recovery.sh
(2) 在VCE的全局配置页面上再次添加vCenter Server连接信息,正确连接vCenter Server并安装插件。
(3) 重新启动vSphere Client,再次查看S1010V的插件页签,即可恢复正常状态
在S1010V配置页签上创建或删除VDS时,出现错误提示“vCenter Server与VCE的连接已经断开。”。
在创建或删除VDS之前,需确保VCE与vCenter Server连接正确。请参考1.4.6 检查vCenter Server是否已连接确认vCenter Server已经连接。
在系统较忙时通过S1010V配置页签创建VDS,因为超时可能会弹出错误提示信息,提示“创建VDS出现错误。”,但是实际却已经创建成功。
这是网络超时导致的错误的提示信息(超时时间为两分钟),并不影响功能,所创建的VDS可以正常使用。
在系统较忙时通过S1010V配置页签删除VDS,因为超时可能会弹出错误提示信息,提示“创建VDS出现错误。”,但是实际却已经删除成功。
这是网络超时导致的错误的提示信息(超时时间为两分钟),并不影响功能,VDS已经被正常删除。
在vSphere Client中,查看ESXi主机的VDS网络信息,显示异常。
图21 ESXi主机的VDS信息异常
出现这种情况,是因为在向VDS中添加主机时,没有选中物理端口所致。请右键点击VDS名称,并选择“管理主机”,在弹出的页面中,选中要管理的主机,并点击“下一步”按钮,然后选择所需要的物理端口。
图22 管理主机
在正常创建VDS之后,重启VCE虚拟机,再次进入H3C S1010V配置页签,此时点击该页面中的“刷新”按钮,页面中的VDS名称发生变化,并不是最新创建的VDS。
该问题是由于此前曾经存在过一台与现有VCE使用相同IP地址的VCE设备,并且在该VCE上创建了VDS。在删除上一台VCE设备时,并没有删除原始VDS,因此在当前的配置页签中,显示了由上一台VCE创建的VDS。请执行以下步骤:
(1) 在配置页签中删除错误显示出的VDS。
(2) 重启VCE,重启后查看界面中显示的VDS是否正确,如仍不正确,请重复执行步骤1,直至显示出正确的VDS。
如果出现VDS删除失败的情况,请检查待删除的VDS是否由不同版本的VCE创建。如果创建VDS时使用的VCE版本与当前不同,则必须安装与该VDS对应的版本的VCE,然后才能删除该VDS。
在S1010V的Port Group配置页面,点击VDP配置链接,出现错误提示信息“iMC连接超时。”。
在进行VDP配置之前,需要VCE与iMC之间建立正确的连接,请参考1.4.7 检查iMC服务器是否已经配置确认iMC已经正确连接。
打开Port Group配置页面,点击VLAN配置链接,发现前期配置的VLAN信息丢失,如下图所示:
图23 VLAN配置丢失页面
在进行VLAN配置之前,需要保证VCE已经与vCenter Server正确连接,
· 请参考1.4.6 检查vCenter Server是否已连接确认vCenter Server已经连接。
· 重新配置Port Group的VLAN信息。
在正常创建Port Group后,关闭vCenter Server,并重新启动VCE,发现Port Group的配置丢失。
图24 无法恢复已创建的Port Group
在重启系统时,应先启动vCenter Server,再启动VCE。启动完成后,点击刷新按钮,可以查看已创建的Port Group信息,表示Port Group配置已经恢复。
图25 显示Port Group信息
在完成Port Group的VDP信息配置后,在Port Group页面下无法选择VSI类型,如图26所示。
点击VSI Type名称后进入VDP信息页面,显示为空,如图27所示。
图27 VDP信息显示异常
出现此现象主要是由于之前配置的VSI类型在iMC服务器上无法获取,可能的原因和对应的处理方式分为以下两种:
(1) 在iMC服务器上重新配置该VSI类型。
(2) 在S1010V的配置页面中重新配置Port Group的VDP信息,并保存配置。
(1) 登录VCE的全局配置页面。
(2) 删除现有的iMC服务器配置,重新添加正确的iMC服务器登录信息。
(3) 在S1010V的配置页面中重新配置Port Group的VDP信息,并保存配置。
(1) 创建一个新的VDS。
(2) 进入端口组管理页面,创建两个新的端口组。
(3) 回到VDS页面,VDS的端口组数量信息仍是创建新端口组之前的信息。
为了不损害页面切换的流畅性,在进入一个页面时,不提供自动刷新功能。请点击VDS页面的“刷新”按钮,即可显示为正确的信息。
(1) 创建一个VDS,并添加一个Port Group名为PG1。
(2) 直接在VDS删除页面删除VDS。
(3) 再次创建VDS,VDS的Port Group信息为之前删除VDS的Port Group信息,如图28所示。
图28 VDS信息显示错误
点击VDS页面的“刷新”后,显示为正确的信息。
重启VCE,进入vShpere Client中的Port Group配置页面,点击上行聚合端口组进入聚合配置,查看端口配置,主机上端口不能显示。
出现此问题的原因是在重启VCE时,vCenter Server被关闭或者网络不可达,导致出现上述现象。
在vCenter恢复正常使用后,重启VCE,该故障即可恢复。
(1) 在ESXi主机与VDS绑定的状态下,可以看到主机上共有10块虚拟网卡(vNIC)连接到VDS上。
图29 EXSi主机已经与VDS绑定
(2) 在VMware vSphere Client中断开ESXi主机。
图30 断开ESXi主机
(3) 然后移除ESXi主机。
(4) 再次添加此ESXi主机到vCenter Server,然后将其加入VDS。
(5) 加入VDS后,查看VDS上的配置页面无法显示之前的虚拟网卡。(之前的10个虚拟网卡业务正常,只是在VMware vSphere Client上没有显示)
(6) 出现这种情况后,用户可以随意删除虚拟网卡之前所在的端口组。(例如下面的端口组VLAN501中有4个VSI在线)。
图31 端口组中存在VSI
(7) 在端口组配置页面可以删除端口组VLAN501,即使该端口组中存在VSI。
图32 删除存在VSI的端口组
(1) 将删除ESXi主机前加入到端口组中的虚拟网卡重新加入到端口组,这样用户就不能随意删除端口组。
虚拟机的虚拟网卡已经加入了VDS的端口组,使用虚拟的ping工具进行测试,虚拟机间无法通信。
(1) 首先请根据H3C S1010V 联机帮助系统中的“Port Group管理 > VLAN功能配置”和“Port Group管理> EVB 功能”中的描述确认端口组上的VLAN配置及VDP配置是否正确。
(2) 检查端口组上配置的VLAN是否在上行端口的VLAN Trunk列表中,如果不在,请在上行端口的VLAN Trunk列表中包含端口组配置的VLAN。
(3) 通过以下方法查看VDP状态是否正常:
a. 在S1010V配置页签中的端口组页面,点击端口组名称,进入vNIC信息页面:
图33 vNIC信息
在上图中,VDP状态一列显示了此端口组中的vNIC的VDP状态。如果显示的是WAIT_SYS_CMD状态,说明vNIC的VDP状态正常,如果显示INIT状态,说明此vNIC的VDP状态异常。
b. 在ToR交换机上输入命令display evb vsi查看交换机上记录的VSI信息
<Sysname> display evb vsi
Status: A -- Association, P -- Pre-association
VSI VTID Type Instance Status
interface version ID
SCH-AGG100:1.0 5 1 8635f3726e2807ac14f... A
SCH-AGG100:1.1 5 1 fb3cf4c517c9bfdf44d... A
SCH-AGG100:1.2 5 1 d63f84c0f08f650c5d0... A
VSI条目的数量应该与VDS中配置了VDP的vNIC的数量相同,如果VSI的状态是A,说明VSI已经关联,处于正常运行中。VSI条目的数量小于VDS中配置了VDP的vNIC的数量,或者VSI条目的状态为P,说明此VSI对应的vNIC没有正常上线。
以上两步显示的vNIC的VDP状态的异常,可能是由于网络状态波动等情况引起,重新把此vNIC加入一次端口组即可。
(4) 请参考1.4.9 检查链路聚合配置检查链路聚合是否配置正确。如果在ToR交换机上把没有连接服务器的端口加入到了正在使用的聚合组中,当ToR交换机向服务器转发报文时,根据负载分担算法,报文可能被通过没有连接服务器的端口发送,导致无法通信。
(5) 参考2.4 通过VFE的维护命令进行故障定位。使用dpctl dump-tables命令查看VFE中的流表数:
~ # dpctl dump-tables 0x768a5defd040e902
Flowtable stats: active_count = 2.
如果系统中存在的流表数量已达到支持的最大数量,则不能创建新的流表,从而影响虚拟机间的通信。请等待流表老化或从VDS中移除不用的vNIC以删除多余流表。
存在广播流量时,重启VCE服务,并把vNIC从VDS中去绑定,在VFE上使用dpctl dump-flows查看流表,发现有关于广播流量的流表残留。
存在广播流量时,重启VCE服务,因为VCE重启后,不再保存重启之前创建的流表信息,导致去绑定vNIC时,无法删除VFE中的对应流表。因为VFE中的流表有超时老化机制,等待其自身老化即可。
在物理交换机与ESXi主机相连的端口或聚合口上开启EVB功能,当ESXi主机上的虚拟机完成VSI接口注册后,执行shutdown命令关闭物理交换机的端口或聚合口。在VSI接口超时下线后,重新开启物理交换机的端口,则仅有部分VSI可以上线;重新开启物理交换机的聚合口,则之前注册的所有VSI均无法上线。
出现此问题是由于物理交换机的端口上默认开启了STP功能,当端口由关闭状态变为开启状态时,会自动与对端端口进行STP协商,而对端是ESXi主机的物理网卡接口,不支持STP功能,因此只能等待协商超时。在协商期间,STP端口的状态为Discarding,不接受用户报文,因此无法完成虚拟机的VSI注册。
解决此问题需要将物理交换机与ESXi主机相连的端口或聚合口配置为STP边缘端口,即在端口视图或聚合接口视图下执行stp edged-port命令。
当两个虚拟机的网卡分别绑定到端口组,并且交换机上的VSI稳定为在线状态后,在vSphere Client上同时迁移这两台虚拟机的存储,会出现VSI掉线的情况。
出现该故障原因为:在同时迁移两个虚拟机的存储时,VMware ESXi主机上报事件的顺序出现异常,导致VSI掉线。请在迁移多台虚拟机的存储时,逐台进行迁移操作,避免同时迁移,即可避免问题出现。
如果使用本手册中的介绍的故障排除方式无法解决您的问题,您可以联系H3C技术支持人员寻求进一步的帮助。在您联系H3C之前,请准备好以下信息,以便技术支持人员能够尽快帮助您解决问题:
· 您所使用的H3C S1010V虚拟交换机版本
· VMware vSphere版本,包括ESXi版本和vCenter Server版本
· 您的联系方式
· 故障现象的概要描述
· 您针对该问题已经尝试过的故障排除操作
· 按信息收集中的介绍进行操作所获取的信息
在全局配置页面点击左侧导航栏的日志收集标签,即可收集VCE的日志信息:
图34 日志收集功能
可以选择收集系统日志或是收集操作日志。选择后,点击下方的按钮即可收集相应的日志。
通过SSH客户端登录到主机,可使用hvsw-support命令收集VFE在运行期间的信息并保存到一个指定的文件中:
~ # hvsw-support
Log is collecting, please wait...
hvsw-support/
hvsw-support/hvsw-syslog.log
hvsw-support/hvsw-vmkernel.log
hvsw-support/syslog.0.gz
hvsw-support/syslog.7.gz
hvsw-support/syslog.6.gz
hvsw-support/syslog.5.gz
hvsw-support/syslog.4.gz
hvsw-support/syslog.3.gz
hvsw-support/syslog.2.gz
hvsw-support/syslog.1.gz
hvsw-support/vmkernel.0.gz
hvsw-support/vmkernel.7.gz
hvsw-support/vmkernel.6.gz
hvsw-support/vmkernel.5.gz
hvsw-support/vmkernel.4.gz
hvsw-support/vmkernel.3.gz
hvsw-support/vmkernel.2.gz
hvsw-support/vmkernel.1.gz
Generating hvsw-support-2012-03-17_00:51:08.tar.gz
表1 hvsw-support命令输出信息描述
字段 |
描述 |
hvsw-syslog.log |
OpenFlow 数据平面代理的当前日志 |
hvsw-vmkernel.log |
OpenFlow数据平面内核的当前日志 |
syslog.*.gz |
OpenFlow 数据平面代理的历史日志,以.gz格式压缩文件保存,星号(*)表示压缩文件的编号 |
vmkernel.*.gz |
OpenFlow 数据平面内核的历史日志,以.gz格式压缩文件保存,星号(*)表示压缩文件的编号 |
hvsw-support-2012-03-17_00:51:08.tar.gz |
日志压缩文件,包括了此次操作期间手机的所有OpenFlow数据平面日志。2012-03-17_00:51:08表示此日志压缩文件的收集时间。 |
打开vShpere Client,左侧菜单定位到主机后,右侧显示点击“配置”标签,如下图所示:
图35 配置标签
登录iMC主页,点击右上角“关于”链接,弹出如下页面。
图36 iMC版本信息
iMC主页面点击”资源”下拉框,点击“设备视图”即可,如下图所示:
图37 设备视图
在ToR交换机的命令行界面用户视图下输入如下命令:display diagnostic-information。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!