• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们
首页 支持 文档与软件 软件下载 服务器

R4300 G5 HDM(2022/4/12)

类型:

固件-HDM

版本:

2.98

操作系统:

N/A-N/A

    说明

  • 说明
  • 安装步骤
  • 发布说明
  • 解决问题
  • 新增功能
  • 历史版本
  • 说明

    该软件用于R4300 G5服务器的HDM版本升级

  • 安装步骤

    本章介绍了软件的类型以及如何对软件进行升级,适用于所有支持的服务器。

    B.1 设备软件简介

    H3C HDM是B/S构架,提供WEB页面进行操作。对于服务器的管理以及对于自身软件的升级都是在Web页面上操作完成。

    B.2 备份配置文件

    为了防止升级过程中,配置被覆盖,建议在升级前,进行备份配置文件的操作。

    登录HDM Web,导航到“远程运维>配置管理”页面,如下图所示。

    图2 备份配置文件

    图片 29

     

    单击<导出>按钮,就可以将当前配置保存到本地了。

    B.3 软件升级方式简介

    本操作指导中图例的版本号可能并非当前版本号,但当前版本的安装和升级操作与之一致。

    HDM固件支持在线方式升级,用户可通过HDM网页实现在线升级;HDM升级过程中并不影响主机系统的运行。

    B.3.1 登录HDM

    在web页面登录HDM,本次示例IP:172.17.0.211,版本升级到HDM-2.13为示例,登录用户名admin,密码:Password@_。

    图3 登录HDM

    图片 23

     

    登录完成后,选择远程运维>固件更新

    图片 224

     

    B.3.2 执行升级

    固件更新过程中不要刷新页面。

    固件更新过程中,请勿对服务器进行上下电操作,否则可能会导致HDM部分功能以及操作系统出现异常。

     

    1. 选择固件更新页面的固件类型以及升级文件

    图示仅仅是说明,实际选择过程中,应该选择对应版本的xxxx_signed.bin文件。

    图4 选择固件类型以及升级文件

    图片 22

     

    除非版本说明中特别提示,否则升级过程中不要选择覆盖所有配置。选择后,会导致所有设置恢复到默认设置。

     

    2. 文件上传及镜像版本确认

    图5 文件上传及镜像版本确认

    图片 228

    图片 230

     

    3. 完成HDM固件更新

    图6 完成HDM固件更新

    图片 30

     

    4. 执行重启HDM

    如图3中的HDM更新配置选择的是“更新后手动重启”,则需要单击[远程运维/固件更新]菜单项,单击<重启HDM >,进行HDM重启。否则跳过此步骤。

    图7 执行重启HDM

    图片 31

     

    5. 查看固件升级生效

    管理员重新登录HDM,查看到主分区镜像版本已经升级。

    图8 查看固件升级生效

    图片 229

     

    6. 重启HDM后再执行一次升级过程

    待HDM重启后,重新登录HDM,再依次顺序执行升级过程。

    B.4 软件升级失败的处理

    软件包升级失败后,系统会使用原版本的启动软件包运行。用户可以通过以下方式尝试解决软件升级失败问题。

    (1)固件类型选择错误,请确认升级过程中选择的固件类型为“HDM”。

    (2)升级包错误,请确认下载的是适用于G5服务器的HDM升级包。

    (3)升级包已损坏,请重新下载升级包进行升级。

    (4)请检查HDM和升级机器之间的网络是否通畅。

    B.5 浏览器清除缓存的方法

    B.5.1 IE浏览器清除缓存

    第一步:选择“工具”->“Internet选项”。

    图9 Internet选项

    图片 6

     

    第二步:在弹出来的对话框中点击“删除”,然后在弹出来的对话框中点击“删除”。

    图10 清除缓存

    图片 8

     

    B.5.2 Firefox浏览器清除缓存

    第一步:选择“打开菜单”->“选项”。

    图11 打开选项

    图片 9

     

    第二步:在弹出来的对话框中点击“隐私”,然后点击“清空近期历史记录”。在弹出来的对话框中点击“立即清除”。

    图12 清除历史记录

    图片 10

     

    图13 清除全部记录

    图片 11

     

    B.5.3 Chrome清除缓存

    第一步:选择“自定义及控制”->“历史记录”。

    图14 选择历史记录

    图片 13

     

    第二步:点击“清除浏览数据”。

    图15 清除浏览数据

    图片 14

     

  • 发布说明

    版本使用限制及注意事项

    (1)本版本适用于本文档所有列出的支持的服务器。

    (2)在没有挂载镜像的情况下,KVM窗口会随着HDM Web会话超时而自动关闭。

    (3)在同一台PC上使用同一个浏览器,同时打开两个窗口,用不同用户名登录到同一个HDM,第二次登录的Web会话会自动踢出第一次登录的Web会话。

    (4)使用HDM Web界面时,如果使能浏览器禁止弹出框的功能,会导致HDM Web无法正常使用。

  • 解决问题

    13.1 HDM-2.98版本解决问题列表

    1. 202203050362

    问题现象:R4950 G5主机配置Milan CPU,当CPU工作过程中发生LS-HWA故障时,HDM无法检测该故障并上报告警日志。

    问题产生条件:R4950 G5主机配置Milan CPU,CPU工作过程中发生LS-HWA故障。

    2. 202201210384

    问题现象:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出,HDM无法检测该故障并上报告警日志。

    问题产生条件:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出。

  • 新增功能

    5.1 HDM-2.98版本硬件特性变更说明

    R4900 G3新增option适配:

    DERA D527 1.92T

    6.1 HDM-2.98

  • 版本:3.44.01(2024/2/7)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.44.01版本解决问题列表

    问题现象:R4900 G3服务器运行497天后在部分监控平台的SNMP V3 Trap告警无法显示。

    问题产生条件:R4900 G3服务器运行497天监控SNMP V3 Trap。

    新增功能

    2.1 HDM-3.44.01版本硬件特性变更说明

    版本:3.43(2024/1/3)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.43版本解决问题列表

    问题现象:R4930 G5(H3)服务器配置25SFF硬盘背板和后置4SFF Unibay硬盘背板,且后置4SFF Unibay硬盘背板中装配NVME硬盘,HDM存储管理界面下的物理视图展示的NVME硬盘信息跟实际不符。

    问题产生条件:R4930 G5(H3)服务器配置25SFF硬盘背板和后置4SFF Unibay硬盘背板,且后置4SFF Unibay硬盘背板中装配NVME硬盘。

    问题现象:服务器配置LSI RAID卡,小概率出现RAID卡下挂接的硬盘全部上报drive fault误告警。

    问题产生条件:服务器配置LSI RAID卡,小概率出现问题。

    问题现象:R4900 G5服务器因电网环境不稳定出现AC瞬断,BMC上报为主板电源故障。

    问题产生条件:R4900 G5服务器因电网环境不稳定出现AC瞬断。

    新增功能

    2.1 HDM-3.43版本硬件特性变更说明

    R4930 G5 H3新增option适配

    SSD-3.2T-NVMe-PB6537-AIC

    SSD-6.4T-NVMe-PB6537-AIC

    SSD-3.2T-NVMe-J5310-AIC

    SSD-6.4T-NVMe-J5310-AIC

    SSD-7.68T-NVMe-J5110-AIC

    瀚博GPU VG1000-64G-LP

    NIC-ETH-RP1000SFPH102-3S-10G-2P

    R4900 G5新增option适配

    X710-T2L网卡适配

    版本:3.42(2023/12/5)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.42版本解决问题列表

    问题现象:服务器设置过密码有效期后,hREST工具无法获取信息。

    问题产生条件:服务器设置过密码有效期。

    问题现象:搭配昆仑芯R300模组,概率出现获取不到R300温度,存在散热风险。

    问题产生条件:R5500K搭配昆仑芯R300模组,概率出现。

    问题现象:R5500K风扇功耗页面显示不正确。

    问题产生条件:R5500K,开机待启动完成后设置风扇转速100%。

    新增功能

    2.1 HDM-3.42版本硬件特性变更说明

    R4900 G5新增option适配

    瀚博VA1L GPU适配

    瀚博VA1-16G GPU适配

    支持Solidigm P5520 15.36T硬盘

    R4930 G5 H3新增option适配

    登临GPU Goldwasser-L256

    SSD-7.68T-NVME-PB6531-AIC

    江波龙SATA SSD硬盘

    R5300 G5新增option适配

    天数 BI-V150 GPU适配

    版本:3.41(2023/10/31)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.41版本解决问题列表

    问题现象:服务器设置过密码有效期后,hREST工具无法获取信息。

    问题产生条件:服务器设置过密码有效期。

    问题现象:R4900 G5接8SFF UniBay配置安装硬盘后,HDM界面显示的硬盘在位信息与实际不符。

    问题产生条件:R4900 G5接8SFF UniBay配置安装硬盘。

    问题现象:服务器触发ADDDC故障后未上报日志信息。

    问题产生条件:服务器触发ADDDC故障。

    问题现象:当服务器配置名称中有MB字样的PCIe卡时,触发PCIe卡故障,MCA解析建议是更换卡,但是事件日志上报的却是主板故障,并建议更换主板。

    问题产生条件:服务器搭配含有MB字样的PCIe卡,且该PCIe卡出现告警。

    问题现象:R5500 G5服务器误上报system detected the absence of a DIMM的SEL告警。

    问题产生条件:G5 Intel服务器搭配未认证的内存,执行不断电重启或者断电重启。

    问题现象:R4300 G5服务器HDM获取的硬盘功耗与实际硬盘功耗不一致。

    问题产生条件:R4300 G5服务器接背板、硬盘,从HDM页面读取功耗。

    新增功能

    2.1 HDM-3.41版本硬件特性变更说明

    R4900 G5新增option适配

    支持Solidigm P5520 15.36T硬盘

    支持长城2700W电源

    支持IVA-CP24-VA卡

    R4950 G5新增硬盘背板配置适配

    只接后置4SFF UniBay硬盘背板的配置

    版本:3.40(2023/10/7)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.40版本解决问题列表

    问题现象:R4900 G3服务器出现部分电源故障时,健康灯亮红灯,HDM页面无告警信息。

    问题产生条件:R4900 G3服务器出现部分电源故障时。

    问题现象:R4930 G5 H3服务器配置多块硬盘背板,主机启动过程中低概率出现HDM上报硬盘drive fault和missing告警日志。

    问题产生条件:R4930 G5 H3服务器配置多块硬盘背板,主机启动过程中HDM低概率上报硬盘误告警。

    问题现象:R5500 G5 执行fieldiag,概率性报错。

    问题产生条件:R5500 G5 进行搭配HDM版本,带内执行fieldiag。

    新增功能

    2.1 HDM-3.40版本硬件特性变更说明

    R4900 G5新增配置适配

    支持双95系列阵列卡接12LFF+2SFF UniBay背板配置

    支持9560-8i阵列卡接8UniBay配置

    R4930 G5 H3新增option适配

    NIC-ETH-3S930-LP-2*100G

    R5500 G5新增option适配

    NVIDIA A800 HGX 40G模组适配

    版本:3.39(2023/9/11)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.39版本解决问题列表

    问题现象:服务器搭配25SFF背板,概率性出现Expander温感超温导致服务器异常关机。

    问题产生条件:服务器搭配25SFF背板配置。

    问题现象:HDM页面下删除原有逻辑盘并重新创建同样逻辑盘并设置初始化选项为FULL后,原有逻辑盘的系统及数据未被清除。

    问题产生条件:HDM页面删除并创建逻辑盘并设置初始化选项为FULL。

    问题现象:服务器搭配PMC卡时接入可显示寿命的SSD和NVME后部分SSD不显示剩余寿命信息。

    问题产生条件:服务器搭配PMC卡。

    问题现象:R6700 G3服务器上报内存故障时,日志中的内存槽位号显示异常。

    问题产生条件:R6700 G3服务器CPU3上报内存故障。

    问题现象:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置时,概率出现误报Drive Fault报错。

    问题产生条件:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置概率出现。

    问题现象:R4300 G3服务器使用3.37版本,HDM页面出现内存未认证的轻微告警。

    问题产生条件:R4300G3 服务器使用3.37版本,接多根内存条,执行DC操作,概率出现HDM页面误报内存未认证告警。

    问题现象:B460/B5700 G3机型搭配P5408阵列卡,阵列卡告警后上报的名称为R2140M。

    问题产生条件:B460/B5700 G3搭配P5408阵列卡,触发阵列卡告警。

     

    新增功能

    2.1 HDM-3.39版本硬件特性变更说明

    R5300 G5新增option适配

    Nvidia H800 GPU适配

    Nvidia L40S GPU适配

    RG800 Pro GPU适配

    R4930 G5(H3)新增option适配

    GPU-RG800-32GB-FHFL适配

    25SFF硬盘背板PCA-BP-25SFF-2U-G5搭配NVME硬盘的配置

    R4950 G5新增option适配

    UN-RC-2FHFL-R3-2U-G5 适配

    版本:3.38.01(2023/8/15)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.38.01版本解决问题列表

    202307180160

    问题现象:R4900 G3搭配LSI RAID卡,Ucenter低概率出现上报逻辑盘为Unknow状态。

    问题产生条件:R4900 G3搭配LSI RAID卡低概率出现。

    问题现象:R4900 G3搭配24NVMe配置,在【存储管理】/【物理视图】页签会多显示硬盘在位信息。

    问题产生条件:R4900 G3搭配24NVMe配置。

    202307120329

    问题现象:R4300 G5搭配多盘的配置时,SNMP WALK获取硬盘信息响应时间较慢。

    问题产生条件:R4300 G5搭配多盘配置。

    202308070270

    问题现象:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置时,概率出现误报Drive Fault报错。

    问题产生条件:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置概率出现。

    202307240022

    问题现象:R5500K搭配OCP网卡在压力测试后重启,批量报OCP过温。

    问题产生条件:R5500K搭配OCP网卡,执行压力测试,随后执行DC重启。

    202307192176

    问题现象:R5500G5机型搭配332A网卡,散热存在问题。 

    问题产生条件:R5500G5机型,搭配332A智能网卡,进入FAKE S5。

    新增功能

    2.1 HDM-3.38.01版本硬件特性变更说明

    R4900 G5新增option适配

    无镁光芯片H460-B1阵列卡适配

    无镁光芯片H460-M1阵列卡适配

    版本:3.37.01(2023/7/17)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.37.01版本解决问题列表

    202306200181

    问题现象:R4300 G5搭配9300阵列卡出现概率性转速超过90%的情况。

    问题产生条件:R4300 G5搭配9300阵列卡概率性出现。

    202306240148

    问题现象:R4900 G5使用4GPU Riser,搭配PMC卡,存储页面不显示PMC卡信息。

    问题产生条件:R4900 G5使用4GPU Riser,搭配PMC卡插在槽位3位置。

    202306020382

    问题现象: G5 Intel机型增加内存未认证告警。

    问题产生条件:G5 Intel机型针对未通过H3C认证的内存增加内存未认证告警。

    202302231383

    问题现象: R4300 G5搭配24LFF背板,概率性出现误报硬盘丢失。

    问题产生条件:R4300 G5搭配24LFF背板概率性出现。

    202305221785

    问题现象: R4900 G5搭配LSI阵列卡,出现部分硬盘型号显示和实际不符的情况。

    问题产生条件:R4900 G5搭配LSI阵列卡。

    202306020141

    问题现象:R4900 G5通过Redfish创建逻辑盘,创建成功时返回的响应体中Message拼写错误。

    问题产生条件:通过Redfish创建逻辑盘。

    新增功能

    2.1 HDM-3.37.01版本硬件特性变更说明

    R4900 G5新增option适配

    遂原I20 GPU适配

    版本:3.35.01(2023/5/9)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.35.01版本解决问题列表

    202303260045

    问题现象:R4900 G5搭配多张R200 GPU后SN显示重复。

    问题产生条件:R4900 G5搭配多张R200 GPU后可复现。

    202304271897

    问题现象:4300 G3 HDM版本从3.13升级至新版本后,大量机器随机出现drive fault&disk missing误告警。

    问题产生条件:R4300 G3搭配LSI卡且接有多块盘概率性出现。

    新增功能

    2.1 HDM-3-35版本硬件特性变更说明

    R4900 G5新增option适配

    MBF2H512C-AEUOT

    版本:3.34.01(2023/4/14)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.34.01版本解决问题列表

    202303291487

    问题现象:升级3.33版本后HDM页面上560F网卡网口链接状态信息无法正常显示。

    问题产生条件:使用3.33版本搭配560网卡网卡会出现。

    新增功能

    2.1 HDM-3.34.01版本硬件特性变更说明

    3.1 HDM-3.34.01

    版本:3.31(2022/12/30)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.31版本解决问题列表

    1. 202210310602

    问题现象:服务器配置两张LSI阵列卡,其中一张是HBA-LSI-9400,主机执行重启操作,概率性出现HBA-LSI-9400卡管理的所有硬盘误报Drive Fault和Disk is missing告警。

    问题产生条件:服务器配置两张LSI阵列卡,其中一张是HBA-LSI-9400,主机执行重启操作。

    2. 202212010962

    问题现象:服务器配置一张或多张阵列卡和不带扩展芯片的硬盘背板,在主机先出现阵列卡掉卡,然后主机重启后重新识别到阵列卡的情况下,大概率出现硬盘误报Drive Fault和Disk is missing告警。

    问题产生条件:服务器配置一张或多张阵列卡和不带扩展芯片的硬盘背板,主机先出现阵列卡掉卡,然后主机重启后重新识别到阵列卡。

    新增功能

    2.1 HDM-3.31版本硬件特性变更说明

    R4900 G5新增option适配

    U55C赛灵思FPGA卡

    R4930 G5 H3新增option适配

    GPU-Z100-16G-FHFL

    GPU-Atlas 300I Pro-24G-LP

    RR5300 G5新增option适配

    GPU-Z100L-32G-FHFL

    16G EF-I20 GPU

    3.1 HDM-3.31

    版本:3.30(2022/11/30)

    升级建议

    建议升级

    解决问题

    10.1 HDM-3.30版本解决问题列表

    1.

    问题现象:R6900 G5冷重启过程中概率报错8Unibay上的所有硬盘报错driver fault。

    问题产生条件:R6900 G5机型使用25SFF搭配其他非25SFF背板时概率性出现。

    2.

    问题现象:R8900 G3 AC reboot过程中上报“Transition toNon-recoverable from less severe---System detected a power supply failure onCMOD2.”日志。

    问题产生条件:R8900机型搭配G3-RS3M9PWF-1200W交流电源模块做AC重启后概率性出现。

    3.

    问题现象:R4900 G3 HDM上报的故障日志和解除日志部分信息不一致导致华为esight监控软件不解除故障。

    问题产生条件:触发“Bus Uncorrectable Error”日志后可复现 

    4.

    问题现象:R4900 G3服务器配置LSI-9460-8i阵列卡HDM上报电池告警日志“BBU is Miss”。

    问题产生条件: 阵列卡FW版本与系统内阵列卡驱动不匹配会概率性出现。

    5.

    问题现象:R4900 G3使用3.10版本在逻辑盘重建的时候,会概率上报硬盘in critical array告警,随后解除。

    问题产生条件: 使用3.10到2.98间的版本,逻辑盘在进行重建时概率性出现。

    新增功能

    2.1 HDM-3.30版本硬件特性变更说明

    R4900 G5新增option适配

    UH711a、UH610a、UH630a硬盘适配

    华为1300W电源适配

    R5300 G5新增option适配

    灵犀 GPU-HP300-8GB

    R5500 G5 intel、R5500 G5 AMD新增OPTION适配

    Nvidia A800 8-GPU 80GB GPU模块(PG506)

    3.1 HDM-3.30

    版本:3.26(2022/11/2)

    升级建议

    建议升级

    解决问题

    1.

    问题现象:R4900G3产生IERR告警时故障会指向主板和内存,指向不明确。

    问题产生条件:触发DCU Poison error故障。

    2.

    问题现象:R4930 G5 H3主机BIOS启动过程中,HDM事件日志低概率出现FRB2看门狗告警,同时BIOS会自动重启,重启后业务功能正常。

    问题产生条件:R4930 G5 H3主机BIOS启动过程中低概率出现。

    新增功能

    版本:3.21(2022/10/8)

    升级建议

    建议升级

    解决问题

    无。

    新增功能

    版本:3.13(2022/8/2)

    升级建议

    建议升级

    解决问题

    1.

    问题现象:R5500 G5 intel/AMD 服务器风扇模式默认配置为静音模式,服务器在高负载业务运行过程中,概率性出现HDM事件日志上报GPU过温告警现象。

    问题产生条件:R5500 G5 intel/AMD 服务器风扇模式默认配置为静音模式,服务器在高负载业务运行过程中。

    2.

    问题现象:服务器在持续运行一段时间之后低概率出现无法下载SDS日志,当下载SDS日志时,HDM页面提示“所选时间段内没有SDS日志”的报错现象。

    问题产生条件:服务器持续运行一段时间。

    3.

    问题现象:检测到HDM可能存在缓慢的HTTP拒绝服务攻击。

    问题产生条件:无。

    4.

    问题现象:设备配置LSI Raid卡,运行中概率性会误报”Drive Fault”与”Disk missing”,上报的物理盘槽位不固定,告警会多次触发解除。

    问题产生条件:设备配置LSI Raid卡。

    5.

    问题现象: HDM 配置VLAN,并且收到的网络报文中,报文头中宣称的长度与实际长度不同时,会概率性出现HDM无法连接情况。

    问题产生条件:无。

    6.

    问题现象:R8900 G3服务器历史功率曲线记录的最高功率信息出现毛刺点,超出了设备的正常功率范围。

    问题产生条件:无

    7.

    问题现象:当网络环境较差,使用WEB页面进行升级固件,页面概率性会提示提示当前用户没有权限进行升级。

    问题产生条件:当网络环境较差,使用WEB页面进行升级固件。

    8.

    问题现象:CVE-2021-41617/CVE-2016-20012。

    问题产生条件:OpenSSH存在安全漏洞。该漏洞源于允许权限提升,因为补充组未按预期初始化/OpenSSH 8.7之前版本存在安全漏洞,允许远程攻击者怀疑 SSH 服务器知道用户名和公钥的特定组合,以测试这种怀疑是否正确。 发生这种情况是因为仅当该组合对登录会话有效时才会发送质询。

    新增功能

    新增特性:

    对于支持背板逻辑固件升级的产品,新增支持通过HDM在线升级逻辑芯片为紫光同创型号的背板逻辑固件版本。

    版本:3.13.93(2022/6/20)

    升级建议

    建议升级

    解决问题

    新增功能

    版本:3.10(2022/6/14)

    升级建议

    可选升级

    解决问题

    13.1 HDM-3.10版本解决问题列表

    1.

    问题现象:R4950 G5服务器配置2个电源模块,在主机开机情况下,将2个电源模块依次断电,HDM事件日志会误报Board found PSU output can't be enabled。

    问题产生条件:R4950 G5服务器配置2个电源模块,在主机开机情况下,将2个电源模块依次断电。

    2.

    问题现象:R4930 G5产品配置5系CPU和后部NVME硬盘情况下,HDM的存储信息界面会在不同的槽位下显示同一块NVME硬盘的信息。

    问题产生条件:R4930 G5产品配置5系CPU和后部NVME硬盘。

    3.

    问题现象:服务器配置了Intel CPU,出现内存Uncorrected Error(UCE)故障时,HDM系统健康日志上报的故障类型未区分Fatal/Recoverable/Correct 类型的故障。

    问题产生条件:服务器配置了Intel CPU,并出现内存Uncorrected Error(UCE)故障。

    4.

    问题现象:服务器处于主机状态为开机,使用IPMI命令获取到的主机状态为关机。

    问题产生条件:服务器处于主机状态为开机,使用IPMI命令尝试获取主机状态。

    新增功能

    5.1 HDM-3.10版本硬件特性变更说明

    R4930 G5新增option适配:

    SSD-3.2T-NVMe-D6456

    SSD-6.4T-NVMe-D6456

    SSD-3.84T-NVMe-D6436

    SSD-7.68T-NVMe-D6436

    NIC-ETH-RP2000-LP-2P10G

    R5500 G5新增option适配:

    IB-P23644-B21-200Gb-1P

    R5300 G5新增option适配:

    PCIE_EF_T20_64G_TYPE GPU卡

    PCIE_EF_I20_16G_TYPE GPU卡

    PCIE_EF_I10_16G_TYPE GPU卡

    P5520 硬盘

    MBF2H516C-CESOT 网卡

    NIC-MCX683105AN-HDAT-1*200G网卡

    6.1 HDM-3.10

    版本:2.98(2022/4/12)

    升级建议

    可选升级

    解决问题

    13.1 HDM-2.98版本解决问题列表

    1. 202203050362

    问题现象:R4950 G5主机配置Milan CPU,当CPU工作过程中发生LS-HWA故障时,HDM无法检测该故障并上报告警日志。

    问题产生条件:R4950 G5主机配置Milan CPU,CPU工作过程中发生LS-HWA故障。

    2. 202201210384

    问题现象:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出,HDM无法检测该故障并上报告警日志。

    问题产生条件:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出。

    新增功能

    5.1 HDM-2.98版本硬件特性变更说明

    R4900 G3新增option适配:

    DERA D527 1.92T

    6.1 HDM-2.98

    版本:2.97.03(2022/3/17)

    升级建议

    建议升级

    解决问题

    13.1 HDM-2.97.03版本解决问题列表

    1. 202203110599

    问题现象:HDM恢复出厂设置后,功率封顶会启用,功率封顶值设为500W。

    问题产生条件:HDM恢复出厂设置。

    新增功能

    5.1 HDM-2.97.03版本硬件特性变更说明

    6.1 HDM-2.97.03

    版本:2.93(2022/1/24)

    升级建议

    建议升级

    解决问题

    13.1 HDM-2.93版本解决问题列表

    1. 202112241261

    问题现象:R4900 G3/R4300 G3/R6700 G3配置了PMC卡,PMC卡工作异常,HDM没有检测到异常并上报SEL日志。

    问题产生条件:R4900 G3/R4300 G3/R6700 G3配置了PMC卡,PMC卡工作异常。

    2. 202112280415 

    问题现象:R4900 G3/R5300 G3/R5300 G5/R5500 G5 AMD/R5500 G5 Intel配置了支持NVLINK检测功能的GPU,HDM上报NVLINK CRC故障的SEL日志。

    问题产生条件:R4900 G3/R5300 G3/R5300 G5/R5500 G5配置了支持NVLINK检测功能的GPU。

    3. 202201051030 

    问题现象:R5300 G3 配置支持8张GPU的GPU节点板,节点板的VR电源存在DRMOS烧毁。

    问题产生条件:R5300 G3 配置支持8张GPU的GPU节点板。

    新增功能

    5.1 HDM-2.93版本硬件特性变更说明

    R5300 G5新增option适配:

    GPU-BI-V100-32G

    6.1 HDM-2.93

    版本:2.91(2022/1/4)

    升级建议

    建议升级

    解决问题

    13.1 HDM-2.91版本解决问题列表

    1. 202110150155

    问题现象:SNMP Trap的Test报文添加一个告警级别为通知的字段。

    问题产生条件:使用SNMP Trap 发送Test报文。

    2. 202109090447

    问题现象:SNMP Trap告警模块,设置SNMP Trap模式中,将事件OID模式后的推荐去除。

    问题产生条件:无。

    3. 202109140123

    问题现象:服务器SNMP V2和V3版本trap 报文携带trap OID 发送。

    问题产生条件:使用V2和V3版本SNMP trap。

    4. 202112131150

    问题现象:触发告警时,HDM客户端和邮件服务器服务端在建立TCP连接后,邮件服务器在5s后发送第一个报文,导致HDM侧连接超时,HDM主动发送FIN的结束报文,从而造成告警邮件发送失败。

    问题产生条件:触发告警时,HDM客户端和邮件服务器服务端在建立TCP连接后,邮件服务器在5s后发送第一个报文,导致HDM侧连接超时。

    5. 202110200521

    问题现象:当服务器发生风扇冗余丢失、电源冗余丢失、内存隔离其中一种故障,页面健康状态没有关联事件日志的告警。

    问题产生条件:当服务器发生风扇冗余丢失、电源冗余丢失、内存隔离其中一种故障。

    6. 202111250333

    问题现象:设备配置MCX512A-ACAT或NIC-MCX4121A-F-B-25Gb-2P,HDM页面没有获取不到网卡的连接状态。

    问题产生条件:设备配置MCX512A-ACAT或NIC-MCX4121A-F-B-25Gb-2P。

    7. 202112180531

    问题现象:R4900 G5服务器配置4张GPU_BAIDU_R200 卡,通过HDM web页面升级GPU卡固件,升级失败。

    问题产生条件:R4900 G5服务器配置4张GPU_BAIDU_R200 卡。

    新增功能

    5.1 HDM-2.91版本硬件特性变更说明

    R4300 G3新增option适配:

    PCIE卡 ALIMOC

    R4900 G3新增option适配:

    智能网卡 iETH-MBF2H512C-AESOT-2P-25G

    R5300 G5新增option适配:

    A2-PCIe-16G

    R5500 G5新增option适配:

    A100-SXM4-80GB

    R6900 G5新增硬盘背板适配:

    RS65B25SXP8YD 25SFFF背板

    R6700 G3新增硬盘背板适配:

    RS33B25SXP8YD 25SFFF背板

    R4900 G3新增硬盘背板适配

    RS33B25SXP8YD 25SFFF背板

     

    6.1 HDM-2.91

    版本:2.81(2021/11/17)

    升级建议

    建议升级

    解决问题

    13.1 HDM-2.81版本解决问题列表

    1. 202109280480

    问题现象: R4900 G3配置前部8SFF SAS/SATA+8SFF SAS/SATA+8SFF NVME硬盘,并配置switch卡,HDM界面展示的NVMe盘序展示异常,实际在位Box3-0,但在位信息会多出来一个Box3-3。

    问题产生条件: R4900 G3配置前部8SFF SAS/SATA+8SFF SAS/SATA+8SFF NVME硬盘,并配置switch卡。

    新增功能

    5.1 HDM-2.81版本硬件特性变更说明

    R4900 G3新增option适配:

    长城1300W电源GW-CRPS1300D3

    R4300 G3新增option适配:

    长城1300W电源GW-CRPS1300D3

    R6700 G3新增option适配:

    长城1300W电源GW-CRPS1300D3

    6.1 HDM-2.81

    版本:2.76(2021/9/27)

    升级建议

    建议升级

    解决问题

    13.1 HDM-2.76版本解决问题列表

    1. 202108251029

    问题现象: RAID卡下硬盘组建逻辑盘,逻辑盘出现降级,然后再恢复,这个过程产生的告警触发日志和告警解除日志时间上存在错乱。

    问题产生条件: RAID卡下硬盘组建逻辑盘,逻辑盘出现降级,然后再恢复。

    2. 202108300061

    问题现象: Fru信息读取失败时,BMC_Self_Test传感器显示状态异常,但是没有上报相关事件日志。

    问题产生条件:Fru信息读取失败。

    3. 202108300356

    问题现象:HDM页面的syslog设置中的告警日志主机标识缺少主机序列号。

    问题产生条件:在syslog设置中设置告警日志主机标识为主机序列号。

    4. 202105130683

    问题现象:R6900 G3设备,同一硬盘温感传感器下硬盘都不在位,会导致风扇转速高。

    问题产生条件:R6900 G3设备,同一硬盘温感传感器下硬盘都不在位。

    5. 202108310746

    问题现象:使用duid作为分配地址的依据,给HDM下发地址,在BOND下DHCP v6无法获取IPV6地址,HDM 重启之后可以正常获取IPV6,但是插拔专用口网线之后IPV6就会丢失。 

    问题产生条件:使用duid下发HDM地址。

    6. 202107130260

    问题现象:HDM解析出的故障PCIe槽位没有插PCIe卡时,会导致健康灯亮,但是HDM页面显示正常; 

    问题产生条件:HDM解析出的故障PCIe槽位没有插PCIe卡。

    新增功能

    5.1 HDM-2.76版本硬件特性变更说明

    R4900G3新增option适配:

    NIC-MCX512A-ACUT-2*25Gb Mellanox

    R6900 G5 新增option适配:

    长城1300W电源GW-CRPS1300D3

    长城1600W电源GW-CRPS1600D2

    R4900 G5 新增option适配:

    GPU卡GPU_BAIDU_R200

    R5300 G3 新增option适配:

    GPU卡 GPU-RTX6000B-24G

    R5300 G5新增option适配:

    RAID卡 RAID-P4408-MR-8i-2GB

    NIC-MCX623430MS-CDAB-2*100G

    R5500 G5新增option适配:

    NIC-MCX653106A-HDAT-2*200G

    R4950 G5新增option适配:

    SSD-3.84T-NVMe-PE8010

    GPU-A6000

    R4930 G5新增option适配:

    FAN-6056-2U-G5

    6.1 HDM-2.76

新华三官网
联系我们