• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

H3C iFIST技术白皮书-6W106

手册下载

H3C iFIST技术白皮书-6W106-整本手册.pdf  (390.00 KB)

  • 发布时间:2024/5/17 21:01:30
  • 浏览量:
  • 下载量:

iFIST技术白皮书

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Copyright © 2024 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。


修订记录

日期

修订版本

描述

2019-05-15

V1.0

首次发布

2020-08-11

V1.1

删除存储控制卡存储控制卡配置功能,修改相关描述

2021-10-29

V1.2

增加Smart-Test、日志下载、配置管理、数据安全清除、固件更新的功能描述

2022-06-25

V1.3

修改部分描述

2022-10-17

V1.4

修改部分描述

2023-10-18

V1.5

修改部分描述

2024-03-13

V1.6

修改部分描述

 

 



概述

H3C iFISTH3C Integrated Fast Intelligent Scalable Toolkit,下面简称iFIST)软件是一款内嵌在H3C自研服务器中的单机智能部署工具软件。iFIST提供简洁的用户界面,帮助客户完成RAID配置、OS自动安装、服务器关键硬件的诊断、配置管理、日志下载、固件更新以及数据安全清除功能,为客户的日常使用以及故障定位提供了极大的方便。

iFIST的关键特性:

·     服务器产品出厂默认安装,支持LegacyUEFI双启动模式。

·     良好的硬件兼容性,支持绝大多数的存储控制卡。

·     支持服务器全生命周期的管理,帮助客户在服务器上线、维护、退役的各个阶段进行运维。

iFIST的整体架构如1所示,iFIST包括硬件层、操作系统层以及应用层。

·     硬件层:服务器上存在的硬件存储空间,用来存储Linux操作系统文件以及iFIST应用程序。

·     操作系统层:Linux系统,为iFIST应用程序提供了运行环境。

·     应用层:提供了图形化的用户使用接口,使用B/S架构,展示给用户的是全屏的浏览器页面。

图1 iFIST的整体架构

 

1.1  产生背景

iFIST聚焦于服务器的单机部署与诊断功能,满足服务器的运维人员在服务器日常管理中的大部分需求。除特殊情况外,H3C的服务器出厂默认安装iFIST软件,服务器的运维人员可以随时随地对服务器进行单机管理。

1.2  技术优点

iFIST软件立足于给客户提供单台服务器的全生命周期的管理。在服务器上线、维护以及退役的多个阶段都提供了相应的功能。通过简单的页面,降低了客户的学习成本、减少了客户的维护时间、增强了客户的使用体验。

iFIST中包含的功能有:

·     iFIST提供统一的页面支持服务器的RAID配置功能。支持各种控制卡工作模式下创建逻辑盘、删除逻辑盘以及逻辑盘导入导出的功能。

·     iFIST支持Windows ServerRedHat Linux EnterpriseSuse Linux EnterpriseCentOSVmware ESXiUbuntuH3C CASOracle Linux等主流操作系统的自动安装,结合REPO可实现安装操作系统后自动安装驱动的功能,同时支持系统参数配置的导入导出功能。

·     iFIST支持服务器硬件的诊断功能,为服务器的安全稳定运行保驾护航。

·     iFIST支持服务器的配置管理功能,支持导入/导出HDMBIOS以及RAID配置。

·     iFIST支持固件更新功能,支持更新HDMBIOSCPLD、网卡、存储控制卡、硬盘等固件的版本。

·     iFIST支持数据安全清除功能,支持清除HDMBIOS以及存储系统的用户数据,防止用户信息泄露。

·     iFIST支持日志下载功能,支持下载OSSDS、存储控制卡以及硬盘的日志。

RAID配置技术

2.1  概念介绍

RAIDRedundant Arrays of Independent Drives的缩写,该技术增加了服务器存储系统的安全性以及稳定性。服务器厂商为了实现该技术,需要在服务器上安装名为存储控制卡的硬件设备。该硬件设备可以将服务器的若干硬盘组成一个整体存在,这个整体被称为逻辑盘以区分物理盘(即硬盘)。逻辑盘可以提供数据冗余存储、数据校验等功能。iFIST提供了统一的Web页面,支持用户在不同的存储控制卡环境下快速创建逻辑盘,简化了RAID创建过程,提供了配置效率。

2.2  功能介绍

 RAID配置功能基本可以分为三大项,分别为RAID创建、物理盘管理以及逻辑盘管理。基本功能有:

·     在“创建RAID”界面,用户可以配置RAID名称、RAID级别、选择成员盘等参数去创建一个符合要求的逻辑盘。

·     在“物理盘管理”界面用户可以查看物理盘的相关信息,比如物理盘的槽位号、状态等信息,也可以设置物理盘的状态。

·     在“逻辑盘管理”界面,用户可以查看逻辑盘的相关信息,比如名称、级别、容量等信息,也可以批量删除逻辑盘。

说明

·     RAID配置页面因为控制卡的不同,可能会有稍许不同。请用户根据实际场景参考用户手册或者联机帮助完成操作。

·     某些存储控制卡,如HBA-LSI-9300系列,不支持创建逻辑盘,所以只支持“物理盘管理”的功能。

 

2.3  机制介绍

iFIST系统集成了存储控制卡的驱动以及各控制卡厂商提供的管理工具或者API接口,基本支持所有H3C服务器支持的存储控制卡类型。当用户在页面上进行了相关操作之后,iFIST自动调用厂商提供的工具完成相关的功能。

OS自动安装技术

3.1  概念介绍

用户在手动安装操作系统时,经常性的会遇见如下问题。

·     安装的操作系统镜像中没有集成存储控制卡驱动,导致在安装的过程中识别不到硬盘。

·     在操作系统的安装过程中需要手动干预,比如需要在安装中间输入安装参数,增加运维时间。

·     在操作系统安装完成后,需要手动安装驱动。

iFIST的工程师为了解决上述三个问题,推出了服务器的OS自动安装功能。用户只需要在iFIST的页面上输入若干个安装参数,在iFIST的帮助下,可以实现全程无需干预的OS自动安装功能。

3.2  功能介绍

在进入系统配置页面后,iFIST后台首先会检测镜像源以及驱动包是否存在。根据用户选择的“镜像源”(光盘或者U盘)去自动检测需要安装的镜像类型。同时会匹配用户选择的基准库(光盘和U盘)以及iFIST内置的驱动,筛选出可以安装的驱动列表。以Windows操作系统为例,本功能用户可以配置的参数有:

·     支持选择驱动列表。iFIST软件会做初步筛选,选出当前设备上硬件存在的且和操作系统所匹配的驱动包。

·     支持选择镜像文件。比如Windows Server 2012 R2 ISO镜像中有两个版本,分别为STANDARD以及DATACENTER

·     支持配置主机名称、密码和密钥。

·     支持选择安装的目标盘和容量。可以将系统安装到用户指定的目标盘,防止因为目标盘的不确定性,导致用户数据的丢失,目标盘支持选择物理盘或者逻辑盘。

说明

·     系统配置页面因为操作系统的不同,会有稍许不同。请用户根据实际场景参考用户指南或者联机帮助完成操作。

·     基准库即H3C REPO,是H3C为服务器硬件发布的驱动和固件集合。

 

3.3  机制介绍

3.3.1  OS自动安装

各操作系统提供商都提供了自动安装操作系统的方法,比如Linuxks.cfg文件机制或者Windowsunattend.xml文件机制。iFIST软件的开发人员在深入研究各厂商的自动安装机制之后,给用户提供了大部分主流操作系统的自动安装功能,并且解决了因为部分操作系统的控制卡驱动不兼容,导致安装过程中无法识别硬盘的问题。操作系统的自动安装可以给用户节省了大量的时间成本,减少了运维投入。

说明

·     ks.cfg文件用于Linux系统的自动安装,在此文件中,可以配置用户名、密码等参数。ks.cfg文件的有一套详细的语法规范,详细请参考操作系统厂商提供的相关资料。

·     Unattend.xml文件用于Windows系统的自动安装,它的作用和ks.cfg相同。

 

3.3.2  驱动自动安装

在服务器安装操作系统之后,相关的运维人员经常会遇见驱动过旧或者驱动不支持的情况,此时iFIST的驱动自动安装功能将是解决这一问题的利器。iFIST配合REPO驱动包,可以实现安装操作系统后自动安装驱动的功能,真正做到操作系统的全自动安装。iFIST在操作系统的安装完成后且第一次使用前这两个阶段中间自动插入了一个新的部署阶段,此阶段会自动执行相关的脚本,实现驱动的自动安装。

服务器硬件诊断技术

4.1  概念介绍

服务器在经过长时间运行之后,部分硬件设备可能因为物理损耗等原因出现故障,从而引起系统宕机等问题。H3C从日常运维的经验中发现,这种硬件故障可能会不规律的出现,甚至在服务器的正常使用中难以复现,给服务器的稳定运行增加了安全隐患。iFIST软件的研发工程师为了解决上述的问题,推出了服务器的硬件诊断功能。硬件诊断功能通过给相关硬件增加运行压力,可以快速、准确的排查硬件故障。

·     设备扫描:向用户展示当前服务器上运行的硬件设备,使用户可以快速了解服务器整体状况,确认设备是否齐全,配置是否正确。

·     快速诊断:对服务器的硬件做基础的检测,排查较容易出现的硬件故障。

·     压力测试:对服务器的硬件做完整的检测,排查不容易出现的硬件故障。

·     内存Smart-Test测试:对服务器的内存进行测试或者修复操作。

4.2  功能介绍

服务器诊断用于对服务器关键硬件设备进行检测。当前支持下述功能:

·     支持对CPUMemoryPSUFanHDMPCIeNICGPU等服务器关键设备的信息获取。

·     支持对CPUMemoryPSUFanHDMPCIeNICGPU等服务器关键设备的故障诊断,诊断分为快速诊断以及压力测试两种模式。

·     支持查看硬件的测试状态以及测试结果。

·     支持将设备信息及测试结果导出到U盘。

·     支持内存Smart-Test测试。

说明

仅支持部分厂商的内存进行Smart-Test测试,请用户根据实际场景参考用户指南或者联机帮助完成操作。

 

4.2.1  设备信息

iFIST通过图像化页面,向用户展示了当前服务器上存在的硬件设备。设备信息包括System信息、BIOS信息、HDM信息、CPU信息、Memory信息、Storage信息、NIC信息、GPU信息、其他PCIe卡信息、PSU信息、Fan信息以及Temperature信息。

4.2.2  快速诊断

当用户点击“服务器诊断”按钮时,iFIST会自动检测当前服务器可支持诊断的硬件设备。用户可以在检测到的硬件列表中自由组合本次参与诊断的硬件设备。iFIST提供多种诊断模式,分别为:

·     普通测试:依次完成一次硬件诊断。

·     循环测试:完成指定次数的硬件诊断。

·     限时测试:到达指定测试时间后,完成当前测试项后结束测试。

4.2.3  压力测试

压力测试作为快速诊断的补充,用于发现设备的隐性问题,适合于快速测试无法排查出的故障,最大程度的保证服务器的业务运行。压力测试支持两种模式,分别为:

·     普通测试:依次完成一次硬件诊断。

·     循环测试:完成指定次数的硬件诊断。

4.2.4  导出日志

为了方便用户的运维以及信息传递,在“诊断结果”页签中提供了保存日志功能。用户可以使用此功能将“设备信息”和“测试结果”保存在U盘中。

4.2.5  内存Smart-Test

iFIST支持在UEFI模式下对服务器上的内存条进行测试以及修复操作。在iFIST页面支持配置Smart-Test的相关参数,服务器重启后,在内存初始化阶段将会自动执行相关操作,最后用户在重新进入iFIST页面后可以看到测试结果。

4.3  机制介绍

iFIST不仅可以通过带内的通道从HDM获取硬件信息,还可以通过Linux操作系统获取系统侧的硬件信息,同时用户可以选择快速诊断以及压力测试两种诊断方式排查硬件故障。iFIST的开发人员针对每一种硬件设备都集成了一套完整的诊断方案,相关硬件的诊断方案如123所示。

表1 快速诊断

诊断项

诊断内容

System

整体健康状态测试和序列号合法性测试

CPU

检测CPU数量及CPU下是否有可用内存,并对CPU进行短时间的CPU链路测试以及浮点运算测试,同时检测是否出现MCAMachine Check ArchitectureCPU错误

Memory

通过少数算法模型对内存进行读写测试,并检测是否出现MCA内存错误

Storage

检测存储模块,包括对存储控制卡的带宽、速率、健康状态和电容状态进行检测,NVMe SSDPCIe SSD的带宽、速率检测,物理盘进行硬盘自检,逻辑盘进行连续读功能测试。

NIC

检测网卡的带宽和速率是否低于标准值、MAC是否冲突,并进行网口自检

GPU

检测GPU的带宽、速率是否低于标准值

PCIe

检测PCIe设备的带宽、速率是否低于标准值

PSU

检测电源模块的工作状态

Fan

检测风扇的健康状态

Temperature

检测内存、CPU、电源、存储控制卡和PCIe插槽等组件的温度传感器状态是否正常

 

表2 完整诊断

诊断项

诊断内容

CPU

CPU进行长时间的CPU链路测试连接和浮点运算测试,并检测是否出现MCAMachine Check ArchitectureCPU错误

Memory

通过较多的算法模型对内存进行读写测试,并检测是否出现MCA内存错误

Storage

选择对物理盘、逻辑盘进行长时间的连续读和随机读测试

 

表3 内存读写模型

诊断模式

测试模型

快速诊断

Stuck Address, Compare XOR, Compare SUB, Compare MUL, Compare DIV, Compare OR, Compare AND

压力测试

Stuck Address, Compare XOR, Compare SUB, Compare MUL, Compare DIV, Compare OR, Compare AND, Sequential Increment, Solid Bits, Block Sequential, Checkerboard, Bit Spread, Walking Ones, Walking Zeroes, Walking Data Ones, Walking Data Zeroes

 

对于内存Smart-Test来说,iFIST通过调用厂商提供的系统工具,设置了Smart-Test所需的相关参数。服务器在重启的内存初始化阶段自动完成相关的测试或修复操作。

数据安全清除

5.1  概念介绍

用户在使用服务器的过程中,相关部件特别是存储系统将会保存大量的用户数据,这些用户数据可能是需要保密的信息。在该服务器停止生命周期时或者转交给其他部门使用等场景下,用户需要一个功能用来清除服务器中保存的用户信息且清除后不能或者很难被恢复。iFIST中的数据安全清除功能可以帮助用户完成服务器的安全退役。

5.2  功能介绍

iFIST的数据安全清除技术支持将HDM的配置恢复到出厂默认、BIOS配置恢复到出厂默认、删除BIOS密码、删除NVDIMM中的数据、删除逻辑盘、删除硬盘中的数据、删除服务器SD模块的数据。

5.3  机制介绍

iFIST的数据安全清除采用了NIST Special Publication 800-88 Revision 1, Guidelines for Media Sanitization中的purge方法。使用的技术手段如4所示。

表4 数据安全清除的技术

组件

请求的操作

结果

HDM

恢复配置

恢复配置到出厂状态

BIOS

恢复配置

恢复配置到出厂状态

删除密码

BIOSAdministratorUser用户密码被删除。如果有开机密码,也会同步进行删除

RSTe&VROC

删除逻辑盘

所有逻辑盘全部被删除

PMC&LSI存储控制卡

删除逻辑盘

所有逻辑盘全部被删除

服务器的SD模块

执行DD命令

SD模块中的数据被删除

NVDIMM

使用ipmctl工具,将NVDIMM设置 为内存模式

变成内存模式,相关数据被清除

SATA HDD

执行一次 OVERWRITE EXT选项的 ATA SANITIZE方法

使用零覆盖所有的物理扇区,包括用户无法访问的扇区,所有的数据全部被清除

SATA SSD

执行一次 BLOCK ERASE EXT选项的 ATA SANITIZE方法

无法恢复所有物理内存块中的以前数据,包括用户无法访问的块

SAS HDD

执行一次 OVERWRITE EXT选项的 SCSI SANITIZE方法

使用零覆盖所有的物理扇区,包括用户无法访问的扇区,所有的数据全部被清除

SAS SSD

执行一次 BLOCK ERASE EXT选项的 SCSI SANITIZE方法

无法恢复所有物理内存块中的以前数据,包括用户无法访问的块

NVMe

执行一次SES=2FORMAT方法(如果NVMe支持加密特性)

删除加密秘钥,数据无法恢复

执行一次SES=1FORMAT方法

删除与所有命名空间关联的所有数据和元数据。擦除NVMe中的所有用户内容

 

固件更新技术

6.1  概念介绍

在服务器的使用过程中,某些组件可能因为需要功能升级或者修复bug。用户可以通过iFIST中的固件更新功能,可以实现对服务器固件的快速更新操作。

6.2  功能介绍

iFIST的固件更新功能可以帮助用户使用简单的步骤即可更新相关组件的固件版本。此功能需要配合REPO镜像一起使用,REPO镜像可以放在U盘中、烧录成光盘以及通过HDM虚拟媒体进行挂载。固件更新功能可以升级多种固件,包括HDMBIOSCPLD、存储控制卡、网卡、硬盘等固件。

6.3  机制介绍

·     HDMBIOSCPLD固件更新:iFISTHDM可以通过带内的USB通道进行通信,该通道支持发送IPMI命令以及传输文件。在iFIST中升级HDMBIOSCPLD固件时,iFIST将固件文件通过USB通道发送给HDM,并通过发送IPMI命令触发升级流程。

·     存储控制卡、网卡、硬盘等固件更新:iFIST通过调用各厂商提供的升级工具以及升级文件,完成在系统内更新相关固件的功能。相关的厂商工具已在iFIST中进行了集成,无需用户安装。

配置管理技术实现

7.1  概念介绍

在服务器开局的时候,可能需要对一批服务器进行相同的配置。iFIST的配置管理功能支持HDMBIOSRAID配置文件的导入和导出,方便用户进行服务器部署。

7.2  功能介绍

iFIST支持服务器的配置导入和导出功能,支持的配置有HDM配置、BIOS配置以及RAID配置。

说明

iFIST通过和HDM交互信息获取HDMBIOSRAID配置文件。本模块的RAID配置文件和OS自动安装技术中的配置文件有所不同,OS自动安装技术中的配置文件包括OS安装参数以及RAID配置信息,本模块导出的仅有RAID配置信息。

 

7.3  机制介绍

·     导出配置:iFIST通过带内的USB通道,从HDM导出相关的配置文件到移动U盘中。

·     导入配置:iFIST通过带内的USB通道,将移动U盘中的配置文件导入到服务器的HDM中,可实现配置的快速复制。

日志下载技术

8.1  概念介绍

服务器在运行过程中,可能会出现各种故障。当运维人员到达客户现场以后,根据具体的情况,可能需要收集不同的日志。iFIST中集成了最常用的几种日志的收集,大大减少了现场工程师的收集时间以及收集难度。

8.2  功能介绍

iFIST支持收集4种日志,分别是OS日志、SDS日志、存储控制卡的日志以及硬盘日志。其中OS日志指的是iFIST侧的日志,而不是客户业务系统中的日志,所以不会有安全风险。

8.3  机制介绍

·     收集OS日志:使用系统命令,包括dmidecodelspciLinux系统命令收集相关的硬件信息。

·     收集SDS日志:iFIST通过USB通道从HDM软件中下载SDS日志。

·     收集存储控制卡日志:采用存储控制卡厂商提供的工具收集存储控制卡日志。

·     收集硬盘日志:采用硬盘厂商提供的工具收集硬盘日志。

缩略语

缩略语

英文解释

中文解释

iFIST

Integrated Fast Intelligent Scalable Toolit

集成的快速智能可扩展工具集

BMC

Baseboard Management Controller

基板管理控制器

HDM

Hardware Device Management

硬件设备管理系统

RAID

Redundant Arrays of Independent Drives

独立冗余磁盘阵列

KVM

Keyboard Video Mouse

服务器的远程控制台

OS

Operating System

操作系统

BIOS

Basic Input Output System

基本输入输出系统

UEFI

Unified Extensible Firmware Interface

统一的可扩展固件接口,新型的启动模式

Legacy

Legacy

传统的启动模式

REPO

repository

服务器硬件驱动和固件集合包

MCA

Machine Check Architecture

硬件检测机制

SDS

Smart Diagnosis System

智能诊断系统

IPMI

Intelligent Platform Management Interface

智能平台管理接口

 

新华三官网
联系我们