01-正文
本章节下载: 01-正文 (3.24 MB)
· 由于产品版本升级或其他原因,本文档内容会不定期进行更新。
· 对于本文档中没有介绍的网卡,请联系技术支持。
· 本文中展示的软件界面,以某个软件版本为准进行示例;由于软件会不定期更新,请以产品实际显示的软件界面为准。
· 本文为产品通用资料。对于定制化产品,请用户以产品实际情况为准。
· 本手册中,所有部件的型号做了简化。比如网卡型号IB-MCX653106A-ECAT-100Gb-2P,代表用户可能看到的以下型号:IB-MCX653106A-ECAT-LP-2P、NIC-IB-MCX653106A-ECAT-2P。
· 本手册网卡配置章节主要针对IB网卡的特有功能开展介绍,IB网卡以太网模式的功能配置可参考以太网卡用户指南。
本文档适用于如下型号的网卡,关于网卡的详细信息请参见服务器兼容的部件查询工具。
· IB-MCX653105A-HDAT-200Gb-1P
· IB-MCX653106A-ECAT-100Gb-2P
· IB-MCX653105A-ECAT-100Gb-1P
· IB-MCX556A-ECAT-100Gb-2P
· IB-MCX555A-ECAT-100Gb-1P
本节内容以NIC-IB-MCX653106A-ECAT-2P网卡为例进行介绍。其他网卡,请以实际界面显示情况为准。
如图1-1或图1-2所示,在BIOS Setup Advanced界面,通过PCIe设备的Slot Number和网卡设备的Port Number对应的选项,进入网口配置Main界面。
网卡的配置主界面如图1-3或图1-4所示,主要包含网卡的产品信息、当前连接状态、MAC地址、PCIe Bus地址等信息。具体参数说明如表1-1所示。
|
界面参数 |
功能说明 |
|
Blink LEDs |
设置数值0-15(秒),网口将会按照设置的数值闪烁LED灯, 仅在支持Blink LEDs的网卡上显示该选项 |
|
Device Name |
显示网卡的Product Name |
|
Chip Type |
显示网卡的芯片型号 |
|
PCI Device ID |
显示网卡的PCIe Device ID |
|
PCI Address |
显示网卡的PCIe总线地址信息,Bus:Drvice:Function |
|
Link Status |
显示网口的连接状态 |
|
Network Link Type |
允许用户配置网卡的连接模式,支持在Ethernet/Infiniband/VPI模式切换,仅在Infiniband设备上显示该选项 |
|
Link Speed |
设置网卡的工作速率 |
|
MAC Address |
显示网卡出厂分配的MAC地址 |
|
Virtual MAC Address |
显示网卡的虚拟MAC地址 |
|
Socket Direct Operation |
设置网卡Socket Direct功能的开启或关闭 |
Firmware Image properties界面如图1-5或图1-6所示,主要包含IB卡的固件版本信息,具体参数说明如表1-2所示:
图1-5 Firmware Image properties图形化界面
图1-6 Firmware Image properties文本界面
表1-2 Firmware Image properties界面参数
|
界面参数 |
功能说明 |
|
Family Firmware Version |
网卡的固件版本信息 |
|
EFI Version |
网卡的UEFI驱动版本信息 |
NIC Configuration界面如图1-7或图1-8所示,主要包含IB卡工作在BIOS Legacy模式下的配置,具体参数说明如表1-3所示。
|
界面参数 |
功能说明 |
|
Banner Message Timeout |
设置在Legacy模式下,网卡的提示信息等待时间(0~14s),在等待期间用户可根据提示输入按键,进入Legacy模式的网卡配置界面 |
|
Legacy Boot Protocol |
设置在Legacy模式下网口的启动协议,支持如下选项: · 1 - None - 无启动项,关闭PXE和iSCSI启动功能 · 2 - PXE - 优先使用PXE启动,如果失败则尝试iSCSI · 3 - iSCSI - 优先使用iSCSI启动,如果失败则尝试PXE · 4 - PXE without fail-over - 始终使用PXE启动,失败后不会尝试iSCSI · 5 - iSCSI without fail-over - 始终使用iSCSI启动,失败后不会尝试PXE |
|
IPv4/IPv6 Support |
设置PXE启动使用IPv4或IPv6协议,支持如下选项: · 1 - IPv4 · 2 - IPv6 · 3 - IPv4/IPv6 - 该模式下,如果IPv4启动失败,将会尝试从IPv6启动 |
|
Virtual LAN Mode |
设置开启或关闭网卡启动的VLAN模式 |
|
Virtual LAN ID |
设置网卡启动的VLAN ID,仅在Virtual Lan Mode Enable时有效,取值范围为:1~4094 |
|
Boot Retry Count |
设置网卡启动的重试次数,支持如下选项: · 0 - 不重试 · 1 - 重试1次 · 2 - 重试2次 · 3 - 重试3次 · 4 - 重试4次 · 5 - 重试5次 · 6 - 重试6次 · 7 - 无限循环重试 |
|
Wake on LAN |
设置开启或关闭网卡的Wake LAN功能,该功能允许在带内通过发送一个魔法数据包(magic packet)唤醒服务器,仅在支持WOL功能的网卡显示该选项 |
iSCSI Configuration界面如图1-9或图1-10所示,包含网卡iSCSI相关配置的菜单入口,具体参数说明如表1-4所示。
表1-4 iSCSI Configuration图形化界面参数
|
界面参数 |
功能说明 |
|
iSCSI General Parameters |
设置网卡iSCSI的通用参数 |
|
iSCSI initiator Parameters |
设置网卡iSCSI的启动器参数,例如“IP地址,子网掩码等” |
|
iSCSI First Target Parameters |
设置网卡iSCSI首个目标设备的配置项 |
iSCSI General Parameters界面如图1-11或图1-12所示,主要包含网卡iSCSI功能的通用配置项,具体参数说明如表1-5所示。
图1-11 iSCSI General Parameters图形化界面
图1-12 iSCSI General Parameters文本界面
表1-5 iSCSI General Parameters界面参数
|
界面参数 |
功能说明 |
|
Boot to Target |
设置网卡从iSCSI target 启动,支持如下选项: · 1 - Enable,开启 · 2 - Disable,禁用 · 3 - One time disabled,仅禁用一次,下次启动后开启 |
|
TCP/IP Parameters via DHCP |
设置开启或关闭网卡通过DHCP获取target参数的功能。 · 开启该功能后,target的IP地址、子网掩码、网关地址、DNS将会从DHCP服务器获取 · 关闭该功能后,target的IP地址、子网掩码、网关地址、DNS将从iSCSI First Target Parameters菜单获取 |
|
CHAP Mutual Authentication |
设置开启或关闭iSCSI initiator和target之间的双向CHAP认证 |
|
IP Version |
设置iSCSI启动使用IPv4或IPv6协议 |
iSCSI initiator Parameters界面如图1-13或图1-14所示,主要包含网卡iSCSI启动器相关的设置,具体参数说明如表1-6所示。
图1-13 iSCSI initiator Parameters图形化界面
图1-14 iSCSI initiator Parameters文本界面
表1-6 iSCSI initiator Parameters界面参数
|
界面参数 |
功能说明 |
|
IP Address |
设置网卡iSCSI启动器的IPv4地址 |
|
Subnet Mask |
设置网卡iSCSI启动器的IPv4子网掩码 |
|
Default Gateway |
设置网卡iSCSI启动器的IPv4默认网关 |
|
Primary DNS |
设置网卡iSCSI启动器的IPv4 DNS地址 |
|
iSCSI Name |
设置网卡iSCSI启动器的IQN(iSCSI Qualified Name) |
|
CHAP ID |
设置网卡iSCSI启动器CHAP ID,如果CHAP Mutual Authentication使能,该参数也将用于iSCSI启动器端反向认证的用户名 |
|
CHAP Secret |
设置网卡iSCSI启动器CHAP密码,如果CHAP Mutual Authentication使能,该参数也将用于iSCSI启动器端反向认证的密码 |
|
IPv6 Default Gateway |
设置网卡iSCSI启动器的IPv6默认网关 |
|
IPv6 Address |
设置网卡iSCSI启动器的IPv6地址 |
|
IPv6 Primary DNS |
设置网卡iSCSI启动器的IPv6 DNS地址 |
|
IPv6 Prefix Length |
设置网卡iSCSI启动器的IPv6前缀长度 |
iSCSI First Target Parameters界面如图1-15或图1-16所示,主要包含网卡iSCSI首个目标设备的配置项,具体参数说明如表1-7所示。
图1-15 iSCSI First Target Parameters图形化界面
图1-16 iSCSI First Target Parameters文本界面
表1-7 iSCSI First Target Parameters界面参数
|
界面参数 |
功能说明 |
|
Connect |
配置开启或关闭网卡从iSCSi target的连接,如果在iSCSI general parameters界面配置DHCP Parameter使能,则本参数将会被忽略。 |
|
IP Address |
配置网卡iSCSI target端的IPv4地址 |
|
IPv6 Address |
配置网卡iSCSI target端的IPv6地址,该参数需要先设置IPv4/IPv6 suppport为IPv6后才可配置 |
|
TCP port |
配置网卡iSCSI target端的TCP端口号,默认为3260 |
|
Boot LUN |
配置网卡从iSCSI target端引导启动的LUN(Logical Unit Number) |
|
iSCSI Name |
配置网卡iSCSI target端的IQN(iSCSI Qualified Name) |
|
CHAP ID |
配置iSCSI target CHAP认证ID |
|
CHAP Secret |
配置iSCSI target CHAP认证密码 |
Power Configuration界面如图1-17或图1-18所示,主要包含网卡电源管理相关配置,具体参数说明如表1-8所示。
图1-17 Power Configuration图形化界面
|
界面参数 |
功能说明 |
|
Advanced Power Settings |
当设置为 Enabled 时,可以配置其他电源设置参数 |
|
Slot Power Limiter |
设置为禁用时,允许设备从PCIe供电槽耗电超过25W |
|
RT PPS ENABLED ONPOWERUP |
设置为 TRUE 时,PPS_OUT 将在上电时激活,当固件功能rt_pps_out_default_sup-ported设置为True时该选项才可配置 |
Device Level Configuration界面如图1-19或图1-20所示,主要包含IB卡虚拟化相关配置,具体参数说明如表1-9所示。
图1-19 Device Level Configuration图形化界面
图1-20 Device Level Configuration文本界面
表1-9 Device Level Configuration图形化界面参数
|
界面参数 |
功能说明 |
|
Virtualization Mode |
设置网卡的虚拟化模式,支持如下选项: · 1 - None - 关闭虚拟化模式 · 2 - SR-IOV - 网卡开启SR-IOV虚拟化模式 |
|
PCI Virtual Function Advertised |
设置网卡可供驱动使用的最大VF(virtual function)数量,仅在Virtualization Mode配置为SR-IOV模式时有效 |
使用“ethtool -i <网口名>”命令可查询网卡驱动版本,如图1-21所示。
图1-21 Linux系统下查询网卡驱动版本
同时按下“Windows 徽标键+R键”,在弹出的“运行(Run)”窗口输入“devmgmt.msc”并按回车,调出设备管理器(Device Manager)。
在设备管理器(Device Manager)中选择网络适配器(Network adapters),在该网卡的属性页面(Adapter Properties)中可查询网卡的驱动版本信息(Driver Version),如图1-22所示。
使用“ethtool -i <网口名>”命令可查询网卡固件版本,如图1-23所示。
图1-23 Linux系统下查询网卡固件版本
同时按下“Windows 徽标键+R键”,在弹出的“运行(Run)”窗口输入“devmgmt.msc”并按回车,调出设备管理器(Device Manager)。
在设备管理器(Device Manager)中选择网络适配器(Network adapters),在该网卡的属性页面(Adapter Properties)中可查询网卡的固件版本信息(Firmware Version),如图1-24所示。
IB网卡查询光模块信息需要安装MFT工具集,可从Mellanox工具下载链接获取。
使用“mlxlink -d <pci_bus_number> -m”可查询当前网卡的光模块信息,如图1-25所示。
图1-25 Linux系统下查询网卡光模块信息
在Windows操作系统下,读取光模块信息需要安装MFT工具集,可从Mellanox工具下载链接获取。
安装完毕后,开启cmd命令行,执行“mst status”查询MST设备名,如图1-26所示。
使用“mlxlink -d <MST设备名> -m”查看当前网卡使用的光模块信息,如图1-27所示。
使用“ibv_devinfo”命令可查询到IB网卡的MAC地址(即GUID),如图1-28所示。
图1-28 Linux系统下查询IB网卡MAC地址
同时按下“Windows 徽标键+R键”,在弹出的“运行(Run)”窗口输入“devmgmt.msc”并按回车,调出设备管理器(Device Manager)。
在设备管理器(Device Manager)中选择网络适配器(Network adapters),在该网卡的属性页面(Adapter Properties)中可查询网卡的MAC地址(Current MAC Address),如图1-29所示。
Mellanox IB网卡支持将端口配置为InfiniBand或以太网模式。默认情况下,网卡的两个端口初始化为InfiniBand模式,如果希望更改端口模式,请参照配置步骤。
访问H3C官网,单击:支持
文档与软件
软件下载,在按产品检索处选择“服务器”,在软件下载页面,通过选择或搜索,获取网卡驱动并参考网卡配套的版本说明书进行安装。
IB卡的端口模式切换操作可以通过BIOS菜单配置,也可在OS下通过网卡配置管理工具设置。
通过mlxconfig工具(网卡驱动程序附带此工具)可设置开启网卡的端口模式。
使用如下命令可以查询当前网口模式,其中<device>为网卡PCI Bus Number:
mlxconfig -y -d <device> query
查询示例如下:
![[root@localhost ~]# mlxconfig -d 18:00.0 query
Device #1:
----------
Device type: ConnectX6
Name: MCX653106A-ECA_Ax
Description: ConnectX-6 VPI adapter card; H100Gb/s (HDR100; EDR IB and 100GbE); dual-port QSFP56; PCIe3.0 x16; tall bracket; ROHS R6
Device: 18:00.0
Configurations: Next Boot
LINK_TYPE_P1 IB(1)
LINK_TYPE_P2 IB(1)](https://resource.h3c.com/cn/202502/27/20250227_12924611_image032_2360476_30005_0.png)
网卡的端口模式由如下两个配置管理:
· LINK_TYPE_P1为第一个网口的模式,值1为InfiniBand模式,值2为以太网模式。
· LINK_TYPE_P2为第二个网口的模式,值1为InfiniBand模式,值2为以太网模式。
使用命令“mlxconfig -y -d <device> set LINK_TYPE_P1=2 LINK_TYPE_P2=2”,可以将网卡的两个端口切换至以太网模式,冷重启后生效,如图1-30所示。
在服务器启动过程中,根据提示按下Delete或Esc进入BIOS Setup界面。
如图1-31所示,选择Advanced页签 > Slot1: Port 1 - Nvidia Network adapter,然后按Enter
如图1-32所示,将Network Link Type选项设置为Ethernet或InfiniBand,完成后按下F4保存配置并重新启动。
服务器上电启动,在POST界面按ESC进入Setup菜单,访问Advanced页签 > Slot1: Port 1 - Nvidia Network adapter,检查Network Link Type选项和上述步骤配置的值一致。
OpenSM(Open Subnet Manager,子网管理器)是InfiniBand子网管理器,所有InfiniBand网络都必须运行子网管理器才能正常工作,即使两台服务器直接连接而没有使用交换机也是如此。大多数InfiniBand交换机都包含一个嵌入式的子网管理器,在Nvidia OFED中也提供了名为opensm的可执行程序,运行在Nvidia OFED堆栈之上,按照InfiniBand规范初始化硬件。
opensm运行在本地计算机的指定IB端口,并且仅管理该端口所接入的网络。如果服务器本地存在其他IB端口,opensm将忽略这些端口所接入的网络。如果未指定端口,opensm将选择第一个最佳的可用端口。默认情况下,opensm运行时将会把日志记录到两个文件:/var/log/messages和/var/log/opensm.log,第一个文件仅记录重大事件,第二个文件包含报告错误的详细信息。第二个文件中报告的任何错误都应当被视作IB网络健康状态异常。当发生不可恢复错误时,opensm将会退出。如果opensm配置正确,两份日志文件都会打印“SUBNET UP”消息。
opensm集成在Nvidia OFED驱动包中,可访问H3C官网,单击:支持
文档与软件
软件下载,在按产品检索处选择“服务器”,在软件下载页面,通过选择或搜索,获取网卡驱动并参考网卡配套的版本说明书进行安装。
可通过修改如下环境变量控制opensm的行为,若使用默认配置则无需设置:
l OSM_TMP_DIR - 控制opensm生成临时文件的目录,临时文件包括opensm-subnet.lst, opensm.fdbs和opensm.mcfdbs。默认情况下,该目录为/var/log。
l OSM_CACHE_DIR - 控制opensm数据缓存的目录,默认情况下,该目录为/var/cache/opemsm。
opensm的默认配置可以满足多达几百个节点的常见使用场景。在默认模式下,opensm将扫描并初始化IB网络结构,并监控网络的变化。
直接执行“opensm”命令可以在默认模式运行opensm。
· 在每一个IB子网中,至少有一台计算机正在运行opensm。
· 如果发生致命错误、不可纠正错误,opensm将会退出运行。
执行命令“/etc/init.d/opensmd start”,可以将opensm作为后台服务运行。
可以利用osmtest工具测试验证opensm是否正常工作,Nvidia OFED驱动包集成有此工具。
操作示例如下:
执行命令“osmtest -f c”生成节点、端口和路径的清单文件,如图1-33所示。
执行命令“osmtest -f a -d1 -i ./osmtest.dat”执行全部验证项。预期结果如下:
![root@localhost ~]# osmtest -fa -d1 -i ./osmtest.dat
Command Line Arguments
Debug Option: Ignore Path Records
File = ./osmtest.dat
Done with args
Flow = All Validations
Nov 22 11:20:48 992908 [60312D80] 0x7f -> Setting log level to: 0x03
Nov 22 11:20:48 992978 [60312D80] 0x02 -> osm_vendor_init: 1000 pending umads specified
Nov 22 11:20:49 024552 [60312D80] 0x02 -> osm_vendor_rebind: Mgmt class 0x03 binding to port GUID 0xb8cef603003bc11a
Nov 22 11:20:49 048120 [60312D80] 0x02 -> osmtest_validate_sa_class_port_info:
-----------------------------
SA Class Port Info:
base_ver:1
class_ver:2
cap_mask:0x2602
cap_mask2:0xB5E8
resp_time_val:0xF
-----------------------------
…
OSMTEST: TEST "All Validations" PASS](https://resource.h3c.com/cn/202502/27/20250227_12924612_image037_2360476_30005_0.png)
IP over InfiniBand(IPoIB)是在InfiniBand远程直接访问(RDMA)网络之上提供的IP网络模拟层。通过IPoIB ULP(Upper Layer Protocol)驱动,允许现有未经修改适配RDMA的应用通过InfiniBand网络发送数据。但是和原生RDMA支持的应用相比性能会偏低。
IPoIB驱动模块ib_ipoib提供了如下功能:
· 在InfiniBand网络创建模拟的VLAN子接口
· 通过Bonding支持高可用性
· 支持修改MTU值:
¡ Datagram mode最大支持4K
¡ Connected mode最大支持64K
· 为发送的数据包插入IP/UDP/TCP校验和
· 计算收到数据包的校验和
· 通过ConnectX®LSO功能支持网卡硬件TSO
· 支持datagram和connected两种操作模式
· connected模式下支持巨型帧
IPoIB还提供了基于以下软件的增强功能:
· Giant Receive offload(GRO)
· NAPI
· Ethtool支持
访问H3C官网,单击:支持
文档与软件
软件下载,在按产品检索处选择“服务器”,在软件下载页面,通过选择或搜索,获取网卡驱动并参考网卡配套的版本说明书进行安装。
IPoIB增强模式(IPoIB enhanced)可以将ULP的基本功能卸载到底层的网卡驱动程序,以此优化IPoIB的数据路径。这将允许IPoIB支持多种无状态卸载,如RSS/TSS,可以使IPoIB datagram的带宽和时延达到最优。
设置ib_ipoib模块参数“ipoib_enhanced”为1,可启用IPoIB增强模式,命令示例如下:
# modprobe ipoib_enhanced=1
执行命令查询当前是否启用了IPoIB增强模式:“ip link show ibX”,其中ibX为OS下IB接口名。
命令执行后将打印ib接口的MAC地址信息,根据MAC地址是否以00:xxxxxx或20:xxxxxx起始判断,如图1-34所示:
图1-34 查询IB接口MAC地址
IPoIB ULP可以工作在两种模式,分别为Connected模式和Datagram模式,默认情况下,IPoIB ULP工作在Datagram模式。为了获得更好的可扩展性和性能,建议使用Datagram模式。
如需修改为Connected模式,参考如下步骤:
· 修改/etc/infiniband/openib.conf配置文件,将SET_IPOIB_CM值设置为YES,如图1-35所示:
· 修改完毕后,执行命令“/etc/init.d/openibd restart”重新启动驱动。
· 执行命令“cat /sys/class/net/ib<n>/mode”检查当前打印结果为“connected”,可以确认模式已被切换至Connected。
· 修改IPoIB模式,需要在IB接口处于“down”状态时操作。
· Connected模式不支持IPoIB enhanced。
MTU(Maximum Transmission Unit, 即最大传输单元),在Datagram模式下,物理端口的MTU支持4K,而IPoIB端口MTU默认值为2K。该参数是由opensm设置的,如果需要将IPoIB MTU修改为4K,可编译opensm配置文件,操作步骤如下:
· 编辑/etc/opensm/partitions.conf文件,写入配置“Default=0xffff, ipoib, mtu=5 : ALL=full”,并保存,如图1-36所示:
图1-36 编辑opensm配置文件
· 执行命令“/etc/init.d/opensmd restart”,重启opensm服务。
· 执行命令“ip link show ib0”,确认ib0接口的MTU值已被设置为4K,如图1-37所示。
图1-37 检查ib接口MTU值
关于partitions.conf文件中的配置参数“Default=0xffff, ipoib, mtu=5 : ALL=full”,其中“mtu=5”代表将所有IPoIB接口配置为4k MTU。如需设置为2k MTU则该参数配置为“mtu=4”。
Bonding技术,能将多块物理网卡上的网卡绑定到一个虚拟网口上,让多块网卡看起来是一个单独的以太网接口设备,用来确保服务器网络质量。
IPoIB接口支持Bonding技术,实现方式和以太网口相同,都是通过Linux Bonding驱动模块。可以按照操作系统标准的网络接口配置脚本(Network Interface Script)格式创建ib和bond接口配置脚本。需要注意的事项如下:
· 网络接口配置脚本编写时,IPoIB slaves接口应当按照IPoIB接口名命名,例如:ifcfg-ib0。
· 对于IPoIB Bonding主要关注的是高可用性(High-Availability),所以推荐的Bonding模式为 mode 1(active-backup)。
· Bonding参数中“fail_over_mac”对于IPoIB是没有意义的,仅支持默认值0。
· 对于Bonding master接口配置文件(如,ifcfg-bond0),除了Linux Bonding标准参数外,还需要增加“MTU=65520”。
· 对于Bonding slave配置文件(如,ifcfg-ib0),“DEVICE”参数应当设置为IB接口名(如:DEVICE=ib0)。
· 对于配置有partitions的设备(如, ifcfg-ib0.8003)的Bonding slave配置文件,“TYPE”参数应当设置为“InfiniBand”(如, TYPE=InfiniBand)。
· 如需在操作系统启动后自动创建Bonding接口请参照如下步骤:
¡ RHEL:创建/etc/modprobe.d/bond.conf,写入内容“alias bond0 bonding”.
¡ SLES:在/etc/sysconfig/network/config文件中更新环境变量“MANDATORY_DEVICES”,将其值更新为IPoIB slave接口名(如,ib0)。
· 重启openibd服务并不能使bonding配置文件生效。在修改完毕Bonding接口配置文件后,可通过重启network服务使Boding配置生效,如:/etc/init.d/network restart。
· 不能将IPoIB接口和以太网接口添加到同一个聚合组下。
可以使用“ifconfig”命令验证IPoIB功能是否配置成功,按照如下操作,将IB节点1的IP地址配置为11.4.3.175,将IB节点2的IP地址配置为11.4.3.176,示例如下:
![]()
可在IB节点1侧,使用命令“ping”节点2的IP地址,示例如下:

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!
