• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

H3C FIST技术白皮书-6W109

手册下载

H3C FIST技术白皮书-6W109-整本手册.pdf  (593.33 KB)

  • 发布时间:2023/8/6 22:27:08
  • 浏览量:
  • 下载量:

H3C FIST技术白皮书

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Copyright © 2019-2023 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。

修订记录

日期

修订版本

描述

2019-05-15

V1.0

首次发布

2022-03-02

V1.3

增加FIST管理设备数量的规格,增加管理机箱设备的内容

2022-05-20

V1.4

新增FIST批量推送软件等内容

2022-06-25

V1.5

新增巡检报告等内容

2022-10-26

V1.6

更新功能参数信息

2023-06-03

V1.7

新增远程支持、能耗管理、基础设施管理、数据中心管理、批量IP设置、SSDP自动发现、基准远程下载和升级、OS安装优化功能


 

1 概述··· 1

1.1 产生背景·· 1

1.2 技术优点·· 1

1.3 配套软件·· 1

2 系统架构··· 2

2.1 系统设计·· 2

3 安全管理··· 3

3.1 概念介绍·· 3

3.2 运行机制·· 3

3.2.1 数据安全·· 3

3.2.2 用户管理·· 3

3.2.3 白名单管理·· 4

3.2.4 维护与更新·· 4

3.2.5 集群管理·· 4

3.2.6 登录安全性信息配置·· 4

4 设备管理··· 4

4.1 概念介绍·· 4

4.2 运行机制·· 4

4.2.1 服务器设备管理·· 5

4.2.2 交换机设备管理·· 8

4.2.3 机箱的管理·· 9

4.2.4 基础设施的管理·· 10

4.2.5 数据中心管理·· 10

5 监控与告警··· 11

5.1 概念介绍·· 11

5.2 运行机制·· 11

5.2.1 状态监控·· 11

5.2.2 服务器的告警监控·· 11

5.2.3 巡检和报告·· 12

6 能效管理··· 13

6.1 概念介绍·· 13

6.2 运行机制·· 13

6.2.1 一键紧急功耗·· 13

6.2.2 机柜智能功耗管理·· 13

6.2.3 能效分析·· 14

6.2.4 能效统计·· 14

7 镜像管理··· 14

7.1 概念介绍·· 14

7.2 运行机制·· 14

7.3 应用限制·· 15

8 模板管理··· 15

8.1 概念介绍·· 15

8.2 机制介绍·· 15

8.2.1 服务器配置模板·· 15

8.2.2 交换机配置模板·· 17

8.2.3 机箱配置模板·· 17

8.2.4 地址池·· 17

8.2.5 网络·· 18

8.2.6 互联模块模板·· 18

8.3 应用限制·· 18

9 组件更新··· 18

9.1 概念介绍·· 18

9.2 机制介绍·· 18

9.2.1 基准和基准清点·· 19

9.2.2 部署节点或同时部署多节点·· 20

10 DHCP服务器··· 21

10.1 概念介绍·· 21

11 PXE服务器··· 21

11.1 概念介绍·· 21

11.2 应用限制·· 21

12 软件推送安装··· 21

12.1 概念介绍·· 21

13 其他功能··· 22

13.1 概念介绍·· 22

13.1.1 网络设置·· 22

13.1.2 时间设置·· 22

14 缩略语··· 23

 


概述

1.1  产生背景

随着互联网技术的快速发展,企业对计算、网络的需求也越来越大。为了保证整个数据系统可靠、稳定的运行,相关企业对运维系统的要求越来越高,运维成本也在随之逐步增加。

H3C公司自主研发的运维管理软件——FISTFast Intelligent Scalable Toolkit,下文统一简称为FIST),可以有效地帮助企业提升数据中心级别的运维能力。企业用户可根据实际需求借助FIST对数据中心内的设备进行灵活的监控以及配置部署,从而打造专属的运维环境。FIST能有效帮助企业提高运维效率,降低运维成本。

FIST可以部署在虚拟机上,作为服务器的运维管理软件。同时,FIST可作为H3C UniServer B16000 AE模块的出厂内置软件,帮助用户对机箱服务器进行配置和管理。在AE的使用场景中,FIST不仅可以管理AE所在的本地机箱,还能够管理网络中的其他机箱服务器、机架服务器、交换机设备,适用于混合IT架构。

1.2  技术优点

·     跨平台支持

FIST支持通过导入虚拟机文件的方式以及绿色免安装等方式进行部署,软件轻量易安装,简化运维人员的部署难度。

·     服务器的批量部署

提供对服务器批量部署的支持,能够大大提升服务器上线前的部署效率。单个FIST节点最多可同时管理5000台服务器、30台交换机。

·     模板化配置支持

提供了对服务器配置模板化的支持,达到将服务器配置和硬件分离的效果,提供无状态计算的功能。

·     开放集成能力

提供基于HTTPS/HTTP协议的RESTful接口,支持第三方厂商将FIST管理系统集成到用户的业务流程中。

1.3  配套软件

在某些应用场景下,FIST需要和其他软件配套使用。本章节对这些配套软件提前做一个简要说明,描述如下:

·     HDMHDMH3C自主研发的服务器远程管理系统,即H3C研发的服务器BMC管理软件。FISTHDM配合使用可以实现服务器的带外管理。

·     FIST SMSFIST SMS是一款安装在服务器操作系统中,用于增强HDMFIST管理功能的软件。通过带内通信丰富了服务器管理功能,支持与HDM的融合,带内、带外管理信息可互通。配合FIST管理软件,实现服务器设备集中管理。

·     OMOMH3C UniServer B16000机箱的管理软件,通过机箱背板与机箱内部其他所有模块互连,实现对机箱各个模块的集中管理和监控。FISTOM配合使用,可以实现对机箱设备的管理。

·     AEAEH3C UniServer B16000机箱的管理节点,AE是一个特殊的机箱节点,出厂预装FIST

·     REPOREPOH3C自主研发的组件包,是服务器固件和驱动的集合。REPO*.iso 的格式存在,该ISO文件支持自启动。

·     iFIST:是一款内嵌在H3C自研服务器中的单机智能部署软件,底层运行着Linux操作系统。FIST某些功能需要将iFIST作为操作媒介。

·     iServiceiService智慧关怀是H3C针对服务器产品量身打造的专属智能云端服务平台,可帮助用户完成专业化的基础运维管理、智能风险预防、急速故障处理等功能。为了满足用户全场景服务需求,iService智慧关怀云端平台提供全新的智能化交付体验,保障服务器安全、可靠、稳定的运行环境。

·     U-Center 2.0U-Center 2.0统一运维平台是H3C开发的数据中心管理软件,U-Center 2.0统一运维平台基于开放容器底座,实现“云、网、端”异构全域混合资源“一站式”管理,以IT资源配置管理为平台底层核心能力,通过构建运维数据中台,萃取运维数据价值,实现高效统一运维。

系统架构

2.1  系统设计

FIST南北向对接方式如1所示。

·     北向:FIST使用BS架构,用户可通过浏览器对相关的设备进行运维和管理,并且提供开放的北向RESTful API接口供第三方集成。同时如1所示,FIST可作为其他平台的组件,提升其他平台的管理能力。

-     FIST支持对接iServiceFIST可作为中枢,将用户的服务器对接到H3C的云平台上。

-     FIST支持对接U-Center 2.0FIST可作为U-center 2.0的一个容器组件。

-     FIST支持对接第三方平台,补充第三方平台的服务器管理能力。

·     南向:FIST南向管理物理设备,通过物理设备提供的相关接口和设备进行信息交互。下面列出每种设备的支持接口:

-     HDM:支持RESTfulRedfishSNMP以及IPMI接口。

-     SMS:支持TCP接口。

-     OM:支持RESTful接口。

-     交换机:支持NETCONFSSH接口。

-     基础设施如CDU:支持Modbus Over TCP接口。

图1 系统框架

 

安全管理

3.1  概念介绍

FIST安全管理包括数据安全以及使用安全两个维度。数据安全包括安全传输通道、敏感信息加密;软件使用安全包括用户管理、白名单管理、FIST软件备份与恢复、集群管理以及配置登录安全性信息功能。

3.2  运行机制

3.2.1  数据安全

FIST支持用户通过HTTP以及HTTPS两种通道进行访问,在用户对数据传输通道的安全性要求比较高的场景下,推荐用户使用HTTPS数据访问通道。

其次,无论哪种访问通道,FIST都对敏感信息进行了加密处理。比如用户在登录时,FIST会将用户输入的密码使用RSA 2048进行加密后再传递给后端进行验证, 防止数据通道被监听导致的密码泄露。同时,用户的密码需要保存在FIST的数据库中,为了防止数据库泄露导致的密码泄露,FIST将密码原文通过MD5+Salt算法进行了加密处理。

3.2.2  用户管理

FIST当前支持adminguest两种权限的用户,admin权限的用户拥有所有的操作权限,guest用户只拥有可读权限。同时,为了增加账号的安全性,FIST提供了配置密码规则的功能。密码规则包括是否开启密码复杂度检查、密码有效期设置、禁用历史密码次数设置、登录锁定设置以及密码过期强制修改密码。FIST最多支持10个用户,支持30个会话同时在线。

同时,FIST支持对接LDAP域名服务器以及添加同一权限的用户组,方便对用户进行统一的管理和权限分配。

3.2.3  白名单管理

FIST支持设置登录的白名单,最多支持配置十条登录规则,只需要满足一条规则即可登录。支持配置的规则有允许登录的时间段、允许登录的IP范围。

3.2.4  维护与更新

FIST支持软件的备份与恢复功能,支持用户手动定期将FIST中的配置备份到本地作为还原点。当用户需要迁移FIST软件时,可以通过导入备份文件将FIST软件恢复到还原点。

备份与恢复功能涉及的数据包括设备信息、组件更新内的任务信息、配置模板/文件信息、地址池信息、用户信息等,不包含REPO基准、“镜像管理”页面上传的镜像、克隆镜像、无盘启动存储卷、监听设置以及FIST自升级的版本更新文件。恢复备份的数据时,会覆盖当前FIST数据。

FIST支持软件的跨版本升级功能,FIST升级不会导致数据丢失,保护用户的业务数据安全性。

3.2.5  集群管理

FIST支持创建1+1主备集群,当前仅支持AE的使用场景。在集群创建成功后,FIST可以自动监控主节点的运行状态,当主节点出现故障时,FIST可以自动切换到备节点,减少因为AE故障导致的业务问题。

3.2.6  登录安全性信息配置

FIST支持多用户管理,所以存在多个用户对同一台设备进行操作的情况。用户可以使用此功能,在FIST登录页面自定义一个提示信息,降低误操作的风险。

设备管理

4.1  概念介绍

FIST支持对H3C服务器、交换机、机箱设备、数据中心、基础设施进行统一管理。用户只需要使用FIST单个软件就可以掌握数据中心内所有设备的使用情况,方便用户运维。

4.2  运行机制

2所示,FIST通过物理设备提供的API接口获取信息,并将获取到的信息展示在WEB页面上。涉及到的接口有:

·     HDMFIST通过RESTfulRedfishIPMI以及SNMPHDM进行交互。

·     FIST SMSFIST通过TCP SocketFIST SMS进行交互。同时,FIST SMS可以通过带内通道(USB)和HDM进行交互,从而FIST在只管理FIST SMS时,也可以获取到HDM的相关信息。

·     Chassis OMFIST通过RESTfulOM进行交互。

·     Switch:即H3C的交换机,FIST通过NETCONF和交换机进行交互。

·     基础设施:主要是CDU设备,CDU(Cooling Distribution Unit,冷冻液分配单元)是给液冷服务器散热的关键设备。FIST通过Modbus Over TCP协议与相关设备进行交互。

图2 设备交互接口

 

4.2.1  服务器设备管理

1. 批量IP设置

机架服务器出厂时,专用口的默认配置为静态地址模式,IPv4地址为192.168.1.2。如果用户采购了大量服务器,在上架前需要单独连接每一台服务器并配置管理口的网络,这样会浪费大量的人力,本功能可帮助用户快速配置服务器的网络,同时在服务器的日常运维中,可能涉及到服务器IP段的迁移,帮助用户快速迁移服务器的IP段。使用本功能可有效节省服务器上架的时间,降低运维成本。

批量修改IP支持三种修改模式、支持修改后自动被添加管理、支持自动添加到静态组、支持配置服务器的认证信息以及支持上传配置模板。配置模板支持xlsxxlstxt三种格式,支持配置HDM专用口/共享口地址模式;支持配置HDM专用口/共享口IPv4IPv6地址参数;支持配置HDM的主机名。

批量修改IP三种修改模式分别为通过原IP修改、通过MAC地址修改、通过服务器SN号修改,详细介绍如下:

·     通过原IP地址:此模式适合IP迁移场景,支持将一批服务器的原IP段批量迁移到新的IP段。

·     通过网口MAC地址修改:此模式适合IP迁移场景以及服务器新上架场景。用户需要录入服务器网口的MAC地址,此网口需要和FIST在一个二层网络中,并且该网卡的IPv6地址为开启状态。FIST可通过网口的MAC地址计算出该网口对应的链路本地地址。链路本地地址也可称为Link-Local地址,该地址是IPv6地址,以FE80开头,可用于二层网络中的设备进行通信。

·     通过SN号修改:此模式适合服务器新上架场景。用户需要录入服务器网口的SN号,服务器的网口需要和FIST在一个二层网络中,该网口的IPv6为开启状态。对于G5服务器及以前的服务器来说,FIST通过不断探测二层网络中的192.168.1.2设备,获取相关设备的SN号和LinkLocal地址。如果该设备的SN号在上传的配置模板中,FIST通过Link-Local地址将用户的网络配置下发到相应的服务器中。对于G6服务器来说,需要服务器开启SSDP服务,该服务会定期在二层网络中发送SSDP报文,该报文中包含设备的SN号和源IP。如果该设备的SN号在上传的配置模板中,FIST将通过SSDP报文的源地址将用户的网络配置下发到相应的服务器中。HDM仅通过Link-Local地址发送SSDP报文, 所以SSDP报文的源地址即HDM专用口或者共享口的Link-Local地址。

2. 添加服务器

支持通过设备添加(单台或批量)和设备发现(IP段搜索)功能添加服务器设备。支持的添加方式有:

·     手动添加:通过IP地址、用户名和密码添加设备。

·     批量导入:通过上传txtxls以及xlsx格式的设备文件,批量添加设备。

发现设备:FIST支持两种模式发现服务器,包括通过SSDP进行搜索或者使用IP段进行搜索。通过SSDP进行搜索仅支持G6服务器,HDM定期向外部发送SSDP报文,该报文中包含设备的SN号和源IPFIST将通过SSDP报文中的源IP(即Link-Local地址)获取到服务器的网络配置,最终自动添加到FIST中进行管理,优先添加顺序为专用口IPv4地址、专用口IPv6地址、共享口IPv4地址和共享口IPv6地址;使用IP段进行搜索支持所有服务器,通过输入起始IP地址、结束IP地址、设备用户名和密码以及搜索次数,FIST可以自动搜索到相关的服务器设备。搜索到设备后,支持自动添加以及手动添加两种模式。

·     自动添加机箱设备上的所有刀片服务器。

支持添加的设备类型有:

·     HDMFIST可通过添加HDM实现服务器的带外管理。

·     FIST SMSFIST可通过添加FIST SMS实现服务器的带内管理。FIST SMS需要运行在服务器的操作系统环境中。为了减轻用户在大批量的服务器上安装FIST SMS软件的工作量,FIST提供了批量安装FIST SMS的功能。此功能使用winRM以及SSHFIST SMS推送安装到Windows以及Linux的操作系统中。

图3 FIST SMS批量安装

 

3. 查看设备基本信息

FIST页面可以获取服务器的基本信息,可获取的信息分为:

·     HDM设备:HDM用户权限、HDM连接状态、HDM主备版本、HDM主备版本编译时间、BIOS版本、BIOS启动项、启动模式、ME的版本、主板CPLD的版本、iFIST的版本、设备的总体健康状态、设备关键部件的健康状态、产品型号、产品序列号、内存信息(服务器支持的总数、在位个数、内存总容量、位置、健康状态、单个内存容量、最大频率、工作频率、标准、厂商、类型、RankECC状态、厂家部件号、厂商序列号、工作电压)、CPU信息(服务器支持的总数、在位个数、健康状态、型号、PPIN、主频、核心数、线程数、是否支持64位、一级缓存、二级缓存、三级缓存)、PCIe信息(槽位号、健康状态、产品名称、厂商ID、厂商名称、设备ID、部件号、序列号、最大速率、协商速率、最高协议、协商协议、最大带宽、协商带宽)、网卡信息(产品名称、接口、设备厂商、芯片厂商、固件版本、健康状态、槽位号、部件号、序列号、端口号、端口MAC地址、端口PCIe地址、端口协商速率、接口类型、连接状态)、存储控制卡信息(型号、固件版本、序列号、WWN、工作模式、接口类型、接口速率、支持的RAID级别等)、逻辑盘信息(逻辑盘ID、逻辑盘名称、逻辑盘状态、逻辑盘级别、逻辑盘容量、逻辑盘的成员盘、条带大小、读/写策略等)、物理盘信息(槽位号、厂商型号、固件版本、序列号、状态、接口类型、接口速率、是否是SSD、容量、剩余寿命、定位灯状态、热备状态等)、温度信息(正面视图、背面视图、3D视图、2D视图、主要部件如CPU的温度)、电源信息(服务器支持的总数、在位个数、电源输入功率、电源工作模式、电源状态、电源槽位号、厂商、型号、序列号、固件版本、额定功率、输入电压、输出电压、电源输入模式、电源供电类型、电源主备状态)、UID灯状态、功率信息(当前总功率、功率封顶值、功率封顶策略)、风扇(服务器支持总数、在位个数、健康状态、型号、转速、转速比)、入风口温度曲线以及功率曲线。

·     FIST SMS设备:产品型号、产品序列号、FIST SMS连接状态、FIST SMS版本、HDM版本、BIOS版本、BIOS启动项、启动模式、设备的总体健康状态、电源状态、UID灯状态、内存大小、系统硬盘信息(总容量、可用容量、已使用容量)、CPU型号及在位数量、网络信息(名称、连接状态、速率、IP信息、MAC地址)、操作系统信息以及服务器关键硬件的性能监控。性能监控包括CPU利用率、CPU利用率预测曲线、空间时间百分比、内存利用率、内存利用率预测曲线、缓存内存大小、网络吞吐量(发送/接收速率)、GPU占用率、磁盘利用率、磁盘I/O、磁盘吞吐量、磁盘读写比例、磁盘队列深度、磁盘I/O延时、慢盘检测、NFS客户端读写速率、NFS服务端读写速率、系统负载。FIST SMS通过带内的IPMI命令以及操作系统内的命令获取上述信息。

当用户添加的HDMFIST SMS位于同一台服务器时,HDMFIST SMS将会合并成一个设备。

4. 设备操作

FIST支持服务器的批量操作,适用于管理大批量服务器的场景,可支持的批量操作类型有:电源管理、下载SDS日志、下载配置清单、重启HDMUID灯控制、编辑设备、删除设备等。

除了批量操作,FIST还支持单台服务器操作功能,可支持的单机操作类型有:访问HDM、打开远程控制台、服务器功率配置。

5. 服务器分组功能

FIST支持服务器分组管理功能。分组管理帮助用户将服务器按照不同业务、不同部门或者其他分组条件对服务器进行分组,帮助用户更有效的管理设备。根据用户的使用场景,FIST支持动态分组以及静态分组功能,动态分组是指用户可以配置服务器的筛选条件,满足筛选条件的设备即可动态的加入该组中;静态分组是指用户直接指定组下的服务器成员,如果用户不做新的配置,组内的成员是不会自动发生变化的。综上所述,动态分组和静态分组主要的差别是用户在创建组时是否需要指定组下的服务器成员。两种分组方式支持的具体功能:

·     动态分组:支持用户创建、复制、编辑、删除动态组。支持设置动态组名称、说明以及查询标准。筛选内容包括服务器的型号、HDM的主机名、HDMIPv4地址;处理器型号、处理器主频、处理器核数、处理器线程数、处理器状态;硬盘厂商、硬盘型号、硬盘固件版本、硬盘状态、硬盘属性、硬盘传输速度、硬盘容量;HDM主备分区版本号、BIOS版本号、CPLD版本号、iFIST版本号;支持用户定义上述筛选条件的组合关系,组合关系包括不等于某个值、小于某个值、小于等于某个值、等于某个值、大于某个值、大于等于某个值、不为null、为null、不包含某个值、包含某个值、开头为某个值、结尾为某个值。

·     静态分组:支持用户创建、复制、编辑、删除静态组。支持设置静态组名称、说明以及服务器成员。在选择服务器成员时,可通过静态组、动态组、型号、关键词进行筛选。

6. 服务器无状态配置

FIST支持机架服务器以及刀片服务器的无状态配置功能。当用户将刀片服务器插到某个机箱的槽位上或者将机架服务器的管理口连接到某个交换机的端口上,FIST自动将提前关联的配置下发到相应服务器上,即能做到“即插即用”的效果。

4.2.2  交换机设备管理

1. 添加设备

FIST支持通过交换机的IP、用户名以及密码添加交换机。

2. 查看交换机的基本信息

当交换机被FIST管理之后,FIST可以通过交换机提供的接口和交换机完成信息交互。FIST支持查看交换机的基本信息,包括:

·     交换机的概述信息:包含制造商、型号等。

·     交换机的单板信息:包含槽位号、CPU和内存使用率等。

·     交换机的端口信息:包括各端口的名称、流量信息等。

·     交换机的接口信息:包括各接口的名称以及状态等。

3. 交换机的流量统计信息

FIST页面可以远程获取交换机端口的流量统计信息,流量统计信息包括:

·     接收/发送的字节数。

·     接收/发送的单播包数。

·     接收/发送的非单播包数。

·     接收/发送的丢弃包数。

·     接收/发送的错误包数。

·     接收/发送的字节速率。

·     接收的不支持包数。

4. 远程操作交换机

通过FIST可以打开交换机的SSH控制台,用户可以在控制台界面输入用户名和密码进入CLI操作环境,从而可以通过输入相关的命令远程操作交换机。

5. 交换机分组

FIST支持交换机分组管理功能。用户可以根据业务类型,给交换机设备增加相应的标签,有助于用户根据标签快速筛选交换机设备。

6. 关联服务器配置模板

通过FIST可以在某个交换机的端口关联一个服务器配置模板,当某台服务器的专用口连接到此交换机的相应端口上,FIST会自动将配置下发到该服务器上。FIST通过此功能,实现了机架服务器的无状态配置。

4.2.3  机箱的管理

1. 添加机箱

用户可以通过添加OMIP、用户名和密码将机箱设备纳入FIST的管理,同时FIST会自动将AE所在的那个机箱设备自动加入管理,上述两种方式都默认添加所有的级联机箱。

2. 获取机箱信息

FIST支持管理多台机箱设备,通过RESTful接口和OM交换信息,可以获取机箱的总体信息,方便运维人员掌握机箱设备的整体状况。FIST支持获取的机箱信息有:

·     基本信息:机箱的前后视图、机箱状态、子系统状态、OM IP地址、位置、资产标签。

·     AE模块:槽位号、自定义名称、产品名称、管理IP、健康状态、UID灯状态、功率、出风口温度、序列号、制造商名称、CPU信息以及内存信息。

·     刀片服务器:槽位号、自定义名称、产品名称、管理IP、健康状态、UID灯状态、功率、出风口温度、序列号、制造商名称、CPU信息、内存信息以及节点互联信息。

·     OM模块:健康状态、UID灯、管理IP、槽位号、设备型号、制造商、固件地址、序列号、CPU利用率、温度信息、系统日志。

·     互联模块:槽位号、健康状态、UID灯状态、电源状态、IP地址、产品名称、CPU使用率。

·     电源系统:槽位号、健康状态、冗余模式、智能电源模式、固件版本、输出功率、额定功率。

·     风扇系统:槽位号、健康状态、固件版本、转速。

·     功率信息:机箱额定功率、可用功率、功率限额、电源输入总功率、电源输出总功率、各机箱模块的实时功率、功率的历史曲线图。

3. 机箱的基本操作

FIST支持机箱设备的基本操作,包括:配置电源冗余模式、配置智能电源模式、分配功率、设置刀片服务器和AE模块的UID灯以及电源、设置刀片服务器的一次性启动项和PXE安装。其中分配功率包括对单个机箱设置功率限额以及对多个机箱设置一个总的功率限额。当对多个机箱设置一个功率限额时,首先FIST会给每个机箱分配一个最低的功率,然后将剩下的功率按照机箱当前使用功率的比例分配给每一个机箱。

4. 机箱网络拓扑图

FIST页面支持展示机箱的网络拓扑关系,包括机箱间的级联拓扑、OMAE的网络拓扑、OM和刀片服务器的网络拓扑、刀片服务器和互联模块的网络拓扑图。

4.2.4  基础设施的管理

FIST支持通过Modbus Over TCP协议纳管机房设备,下面统称为基础设施,目前主要支持对CDU设备进行纳管,同时支持纳管以Modbus Over TCP为北向接口的其他设备。CDU(Cooling Distribution Unit,冷冻液分配单元)是给液冷服务器散热的关键设备,是液冷机房的重要组成部分,它的主要功能是用于将冷板式流体管中的液体或者浸没式TANK中的液体和外界的液体发生热量交换的,从而实现给服务器的关键器件进行高效散温。

FIST对基础设施提供两种管理方式,这两种方式分别应用于已认证的设备和未认证的设备,设备提供商需要提供Modbus Over TCP的北向接口文档。

·     已认证的设备:对于已认证的设备,比如CDU-AVVID-373314-41.5KWFIST将内置该设备的北向接口模板,用户只需要将设备的IP、端口号等信息录入FISTFIST即可对该设备进行纳管。可支持的功能有查看设备厂商分布饼状图,设备健康分布饼状图,设备概况、一次侧信息、二次侧信息、环境信息、CDU传感器分布图;可设置温度、流量、泵模式等功能。

·     未认证的设备:对于未认证的设备,因为FIST无法提前预知相关设备的北向接口,故用户在纳管相关设备之前,还需要在FIST页面配置监控模板。监控模板包括独立型状态传感器、独立型数值传感器、组合型状态传感器、组合型数值传感器,这些传感器的相关定义和设备厂商提供的北向接口有关。通过配置监控模板,FIST可以满足对使用Modbus Over TCP协议的绝大部分设备进行纳管,进而可以满足客户的不同定制需求。对于未认证设备的纳管步骤如下:

¡     设备厂商如CDU设备商提供北向接口。

¡     FIST按照北向接口配置监控模板。

¡     FIST将监控模板与某一设备绑定。

¡     检查设备是否准确被纳管,如果成功被纳管,则添加其他同型号的设备进行统一纳管。

4.2.5  数据中心管理

在一个数据中心内可以存在多个机房,在一个机房内可能存在多个机架,服务器就安装在机架上面。为了便于帮助用户整体掌握数据中心内的服务器分布情况,FIST提供了数据中心管理的功能。

1. 数据中心管理

FIST支持管理数据中心,支持添加、编辑、删除数据中心。数据中心管理有助于帮助用户梳理整个数据中心内存在的设备概况。包括数据中心内存在的机房数量、机柜数量以及服务器数量。

2. 机房管理

在一个数据中心内,可能存在多个机房,FIST支持在某个数据中心内添加机房、编辑机房、删除机房。用户可以配置的参数有机房名称、机房描述、所属数据中心、机房尺寸、机柜朝向。在机房的视图中,用户可以掌握此机房下属设备的整体概况,包括此机房内的机柜数量和服务器数量。

3. 机架管理

在一个机房内,可能存在多个机架,FIST支持在某个机房内添加机架、编辑机架、删除机架。用户可以配置的参数有机架名称、描述、所属数据中心、所属机房、机柜长和宽、机柜高度、在机房的坐标、额定功率,同时支持用户配置服务器在机架中的位置。在机架的视图中,用户可以查看机架的空间使用率、用户设置的机架参数、服务器在机架中的位置以及服务器的概括信息。

监控与告警

5.1  概念介绍

FIST支持多种方式对被管理的设备进行状态监控,方便运维人员更好地了解数据中心的运行状态。FIST通过以下几个方面,实现了设备的监控与告警功能,分别为:

·     设备基本信息:用户可以在FIST页面直观的查看设备的基本信息,详细说明请参考设备管理章节。

·     服务器活动记录:接收被管理服务器的SNMP TRAP信息,让运维人员对服务器的告警了如指掌。

·     告警转发:在FIST接收到被管理服务器的TRAP信息或者健康状态的变化信息后,可以使用SMNPSMTP、企业微信、短信、电话语音等方式转发给用户指定的系统或者移动端。

·     远程支持:FIST提供远程支持(即Call Home)功能,当设备发生异常时,可自动或者手动将服务器的SDS日志传递到H3C智能云端服务平台并自动建单,帮助用户运维设备。SDS日志仅包含用户的设备信息,不包含用户的业务信息,保证用户的数据安全。

·     巡检和报告:FIST支持用户对被管理的设备进行健康巡检操作,同时支持导出巡检报告,方便用户之间进行信息传递。

5.2  运行机制

5.2.1  状态监控

当设备被添加到FIST中,即表示当前这台设备接受FIST的管理和监控。用户可以在FIST页面查看设备的相关信息,了解设备的运行情况。相关内容可以参考设备管理章节。

FIST配套FIST SMS还支持获取服务器系统侧的性能信息,FIST每经过一段时间向FIST SMS获取一次性能指标,FIST SMS通过系统侧的一些接口获取相关的信息。性能监控包括CPU利用率、内存利用率、磁盘利用率以及网络吞吐量。

5.2.2  服务器的告警监控

FIST支持统一监听服务器的TRAP告警信息,并将这些TRAP信息统一展示在用户页面。支持展示的信息有告警发生时间、告警级别、告警状态(是否已解除)、告警服务器、告警详细信息,方便用户在FIST界面就可以掌握整个机房的服务器状态。

1. SNMP转发

FIST支持SNMP转发的功能,可以通过此功能实现服务器故障上报到用户指定的SNMP服务器。支持的SNMP TRAP协议有v1v2c以及v3

2. SMTP转发

FIST实现了SMTP转发的功能,可以通过此功能实现服务器故障的邮件上报。FIST接收到TRAP信息或者健康状态变化信息后,可以通过内置的邮件服务器,将服务器的告警信息发送到指定的目标邮件地址。

3. 微信通知

FIST实现了微信通知的功能,当服务器发生故障时,发送通知到企业微信。FIST接收到服务器的TRAP信息后,将告警信息以用户设定的格式,推送给企业微信的目标用户。

4. 短语以及语音通知

FIST实现了短信和语音通知的功能,当服务器发生故障时,发送短信和语音通知。FIST接收到服务器的TRAP信息后,将告警信息以用户设定的格式,发送短信提醒以及语音提醒给目标手机。

5. 远程支持

FIST“远程支持”功能可作为服务器对接iService智慧关怀云端平台的中枢,在服务器发生异常时,可自动上传SDS日志到iService智慧关怀云端平台。iService智慧关怀云端平台集成了H3C在服务器产品多年的运维经验。iService 智慧关怀云端平台可以智能分析SDS日志,自动创建工单,为用户的服务器设备保驾护航。

“远程支持”支持的功能有支持查看服务器报修状态、配置功能开关、配置iService用户名、配置iService密码、配置iService IP/域名、配置日志上传方式、配置告警自动上报触发条件、配置报修时间限制、配置报修人信息。报修人信息包括用户名称、局点信息、联系人姓名、联系人电话以及合同号。在报修人信息中,如果用户需要同时支持自动创建工单功能,需要购买iService智慧关怀的增强服务。用户在购买增强服务后,将H3C提供的合同号配置到FIST报修人信息中,否则“远程支持”仅仅支持将SDS日志上传到iService智慧关怀云端平台中,用户需要通过该平台手动创建工单,而不具有自动创建工单的能力。

·     “手动方式”指的是用户手动选择设备,将设备的日志上传到iService智慧关怀平台。用户在智慧关怀平台上可查看智能分析后的结果,支持用户在iService智慧关怀平台手动创建工单。

·     “自动方式”指的是FIST检测到管理服务器出现了新的故障,当故障类型匹配到告警策略后,FIST将自动收集故障设备的SDS日志,传递到iService智慧关怀平台,并自动创建工单。

说明

·     iService智慧关怀服务需要注册账号,目前仅支持部分地区注册账号,详情请联系技术支持。

·     用户如果需要支持“自动创建工单”功能,还需要购买iService智慧关怀的增强服务。

 

5.2.3  巡检和报告

FIST支持用户对被管理的设备进行健康巡检和资产盘点,支持导出pdf以及xlsx格式的巡检报告。巡检报告中包含服务器概况信息、CPU信息、内存信息、PCIe信息、网卡信息、电源信息、风扇信息、存储信息、健康状态、BIOS启动信息、序列号、设备型号、资产标签以及固件版本等相关内容。同时为了方便用户掌握设备的宏观分布,巡检报告中还包含设备按照健康状态分布、按照产品型号分布、按照固件版本分布、按照处理器核数分布以及按照内存大小分布的情况。

FIST为了方便用户灵活使用巡检功能,支持用户在巡检时自定义巡检项。用户可根据健康状态、硬件类型、是否需要详细信息等领域去自定义需要导出的巡检项。同时为了方便联系到巡检的操作人员,FIST支持在巡检报告中自定义巡检员的联系方式、客户单位名称、客户单位地址等信息。

能效管理

6.1  概念介绍

在国家碳达峰、碳中和的政策下,业内对数据中心的能耗管理有越来越严格的要求。在此背景下,FIST实现了数据中心的能效管理功能,帮助用户对数据中心的空间、用电量、环境等参数进行统一并有效的管理。

6.2  运行机制

6.2.1  一键紧急功耗

“一键紧急功耗”功能主要使用场景是机房的供电系统出现故障时,应急电源启动或者将要启动的场景。此功能的主要目的是为了更长时间延续业务的使用时间。该功能可能会影响服务器的性能或者造成服务器关机。

此功能支持用户在“一键紧急功耗”页面配置策略模板以及下发紧急策略。因为使用“一键紧急功耗”的场景是机房的供电发生了异常,此时需要尽快处置。所以需要用户在FIST页面中针对每个服务器都提前配置好紧急策略,策略分为三种,分别是:

·     关机:该策略建议配置给低优先级的服务器,当用户下发紧急策略的时候,该批次服务器将会进行关机处理。

·     自定义:该策略建议配置给中优先级的服务器,当用户下发紧急策略的时候,该批次服务器将会进行功率封顶,同时用户可以配置当服务器的功率超过限额的时候,是否进行关机处理。

·     不做处理:该策略建议配置给高优先级的服务器,当用户下发紧急策略的时候,该批次服务器将不会进行任何处理,保证业务正常的运行。

6.2.2  机柜智能功耗管理

用户通常会根据机柜的供电能力去规划机柜上的设备,如果一个机柜的额定功率为4000W,那么用户将会用以每台服务器能达到的最大功率去规划。比如平均每台服务器的最大功率为500W,那么用户会规划8台服务器。但是在实际的场景中,其实每台服务器不会在同时达到峰值,所以按照服务器的最大功耗去规划机器数量,会大大降低机柜的利用率。为了使整机柜的空间使用率和供电安全达到一种平衡,本功能结合功耗AI预测,给整个机架指定一个功率额定值,在不超出机架的功率额定值的情况下,动态给每个服务器分配功率。

FIST页面,用户可以对整个机柜设置一个动态的功率封顶策略,动态指的是整个机柜的功率限额是确定的,但是分配给机柜里每台服务器的功率是动态变化的。FIST每隔30分钟将会根据每台服务器的功率历史数据去预测未来30分钟的功率值,然后根据每台服务器的预测值以及整机柜的功率限额综合考虑给每台服务器分配的功率限额。同时支持在FIST中设置功率封顶参数的生效时间,包括立即一次性生效、延后一次性生效、时间段生效、循环生效。

6.2.3  能效分析

能效分析主要是分析机房中的环境、供电、机架U位以及服务器的使用情况,可以帮助用户有效的提高设备的使用率,从而提高机房能效。能效分析包括服务器入风口温度分析、机柜空间分析、供电分析、服务器使用率分析以及设置上述能效分析的阈值参数的高级设置功能。

·     高级设置:设置入风口温度开关、温度区间、高温次数阈值、低温次数阈值、分析的持续时间;设置机柜空间分析开关、使用率区间;设置供电分析的开关、供电比例区间、高供电次数阈值、低供电次数阈值、分析的持续时间;设置服务器使用率分析的开关,CPU利用率区间、GPU利用率区间、内存利用率区间、分析的持续时间。

·     入风口温度分析:支持检测温度异常的服务器、展示服务器温度状态分布的饼状图、在一个分析周期内产生的高温告警次数和低温告警次数。

·     机柜空间分析:支持检测空间使用率异常的机柜、展示机柜使用率分布的饼状图、机柜所有空间、机柜已使用空间、机柜的使用率。

·     供电分析:支持检测供电比例异常的机柜、展示机柜供电状态分布的饼状图、机柜高供电次数、机柜低供电次数、最近一次供电比例。

·     服务器使用率分析:支持检测使用率异常的服务器、展示服务器负载分布的饼状图、平均CPU利用率、平均内存利用率、平均GPU利用率以及服务器负载比例图。

6.2.4  能效统计

用户可通过该功能查看数据中心视图、机房视图以及机柜视图中设备的功耗统计、空间使用统计、耗电量TOP5U位占有率TOP5信息。通过智能预测算法看到不同维度的功耗预测,分别是单个机柜、整个机房、整个数据中心三个维度的功耗。“能效统计”功能帮助用户掌握整个机房的资源利用情况,帮助用户更好的去管理、分配数据中心的资源。

镜像管理

7.1  概念介绍

FIST支持多种操作系统安装方式,同时也支持安装多种操作系统类型。为了方便用户对操作系统的镜像进行统一管理,FIST给用户提供了镜像管理功能。镜像管理模块可以管理的镜像有操作系统镜像文件、用于无盘启动的卷、用于克隆安装的镜像包。FIST管理的镜像配合模板管理可以实现服务器的操作系统安装功能。

7.2  运行机制

·     操作系统镜像文件:操作系统镜像需要用户通过浏览器上传,FIST将这些镜像文件保存在所在的文件系统中。FIST支持镜像的上传、删除、分类、下载、显示镜像名称、镜像版本、镜像类型以及镜像大小。

·     无盘启动卷:无盘启动指的是服务器将操作系统安装在远端,启动时也从远端位置读取系统文件,卷指的是保存在AE下的一个镜像文件。刀片服务器通过iSCSI协议,将操作系统安装到AE自带的硬盘上,并支持通过iSCSI协议从这个卷文件启动。FIST支持卷文件的创建、删除、复制、显示名称、显示大小、显示连接状态、显示描述信息、显示认证信息。

·     克隆安装的镜像包:克隆安装指的是将一台服务器的操作系统直接克隆到其他服务器的技术,通过克隆安装技术,不仅仅可以克隆操作系统,还支持克隆应用和操作系统驱动。FIST发送命令操作服务器从iFIST启动,iFIST启动后运行相关的脚本可以实现操作系统文件的导出。导出的操作系统文件被打包成一个镜像压缩包,通过Samba软件保存在FIST的服务端。FIST支持操作系统文件的导出、删除、查看镜像名、镜像类型、镜像大小等信息。

7.3  应用限制

无盘启动卷,仅当FIST运行在AE模块时才支持。

模板管理

8.1  概念介绍

FIST支持用户预配置服务器、交换机以及机箱的模板,模板即是设备配置的集合。用户在配置完模板后,通过将模板与具体设备绑定,可以将所有的配置一次性下发给相应设备,减少用户的等待时间。FIST模板功能是初次部署设备或重新部署设备的一大“利器”。

服务器配置模板是一类服务器的通用配置提取,服务器配置模板可以批量应用到一批服务器上,每台服务器自动生成服务器配置文件。

服务器配置文件是一个服务器的配置提取,服务器配置文件自动生成并和服务器一一绑定。

机箱配置模板是一类机箱设备的配置提取,机箱配置模板包括每一个槽位上绑定的服务器配置模板。

8.2  机制介绍

8.2.1  服务器配置模板

服务器配置模板将服务器的硬件和配置分开,是对物理服务器的逻辑虚拟,可以实现服务器的无状态配置。当新服务器上线前,我们可以通过将配置模板和这台服务器绑定,FIST会将文件中的配置下发到服务器中去,做到快速上线的效果。当服务器出现故障后,我们可以将之前保存的配置文件重新绑定到新设备中去,这样可以做到配置的快速迁移,实现快速更换设备的效果。服务器配置模板包括HDM配置模板、BIOS配置模板、连接配置、RAID配置模板、固件基准、以及系统配置模板。服务器配置模板可以批量关联到已被FIST管理的服务器上、可以关联到机箱槽位上、可以关联到交换机端口上。

·     HDM&BIOS配置模板:支持选择HDMBIOS的配置文件的导入以及HDMBIOS在线配置。

·     RAID配置:支持选择控制卡型号、创建逻辑盘、删除逻辑盘、保留模式以及一键创建RAID 0。一键创建RAID 0 指的是将剩余的未组RAID的物理盘全部分别创建为RAID 0Simple Volume;启用“保留模式”,在应用时会对比服务器中已有逻辑盘的“成员盘”和RAID级别,与RAID配置中设置相同的逻辑盘信息可以被保留。如未启用保留模式,则会删除RAID配置中包含的存储控制卡下所有的逻辑盘信息,再根据RAID配置重新设置,请提前备份好数据。系统配置:支持Windows ServerRedHat Linux EnterpriseSuse Linux EnterpriseCentOSVmware ESXiUbuntuH3C CAS等主流操作系统的全新安装;支持RedHat Linux EnterpriseCentOSVmware ESXi操作系统的克隆安装。

·     连接配置:支持配置服务器业务口的网络参数。

·     固件基准:支持选择REPO LiveCD镜像,可一键升级服务器上存在部件的所有固件。

·     服务器配置模板支持批量应用到服务器,支持立即、定时以及循环应用。

1. HDM&BIOS配置

FIST支持管理HDM以及BIOS的配置,FIST支持配置文件的导入导出、在线配置两种方式。典型的应用场景是用户需要将大批量服务器的HDM/BIOS配置成某一种或者某几种配置。配置文件的导入导出方式首先用户需要选择一台服务器,手动将HDM/BIOS配置成目标配置,接着可以将此台服务器的配置作为模板进行导出,最后将此模板批量导入到其他服务器中去;在线配置支持用户在Web页面配置HDMBIOS的配置项,配置完成后批量下发到待上架的服务器上。此功能可以实现服务器上线前的大批量配置,减少了大量的运维成本。。

HDM/BIOS配置模板的特点:

·     支持一键导出以及在线配置两种方式,操作简单方便。批量复制,简化服务器HDM/BIOS配置管理。

·     带外环境,与用户业务环境分开。

2. RAID配置

当存储控制卡支持带外配置RAID时,FIST通过调用HDM的接口实现RAID配置;当存储控制卡不支持带外配置RAID时,FIST会控制服务器从iFIST启动,并将RAID配置信息发给iFIST,由iFIST完成配置操作。

RAID配置的特点:

·     带外配置,与用户业务环境分开。

3. 连接配置

对于机架服务器来说,连接配置支持用户在应用服务器配置模板的同时下发端口配置到服务器所连接的交换机的对应端口。FIST通过NETCONF协议调用交换机的相关接口,配置交换机端口的VLAN

对于机箱的刀片服务器来说,连接配置支持用户在应用服务器模板的同时,下发配置到服务器的Mezz卡以及互联模块的下行端口和上行端口。FIST通过调用OM的相关接口,可以实现配置端口的网络模式、端口速率、VLAN ID等参数。

连接配置可以建立机架服务器的系统应用到交换机下行端口的网络传输通路,也可以建立刀片服务器的系统应用到互联模板上行端口的网络传输通路,可以做到业务的快速切换。

4. 系统配置

服务器的系统配置当前支持通过镜像安装以及克隆安装,两种方式都需要FISTiFIST配套完成。

·     镜像的自动安装是通过定制操作系统的自动安装脚本去实现的,比如Linux需要根据配置定制ks.cfg文件,Windows需要根据配置定制Unattend.xml文件。用户在FIST页面配置好相关的参数,当服务器配置模板与具体设备绑定时,FIST会操作服务器从iFIST启动。iFIST启动后,FIST将相关的配置发送给iFIST,最后由iFIST完成相关的安装流程。在G6服务器之前,FIST通过KVM挂载的方式,将操作系统镜像挂载到各个服务器上,FIST将作为镜像信息发送源,此时FIST的网络带宽将会成为操作系统安装的瓶颈,当网络带宽大时,传输速度快,进而安装速度快,反之则安装速度慢;在G6服务器上,对于主流的操作系统安装,FIST采用“裂变”传输的全新技术,此时FIST和待安装服务器的HDM都作为镜像源。当其中一个HDM拥有镜像的一个片段,其他的HDM不仅仅可以从FIST获取这个镜像片段,也可以从这个HDM获取镜像片段。在“裂变”传输技术下,FIST的网络带宽将不会成为瓶颈,整个系统的网络都被调度起来,大大的加速了镜像传输速度,特别适合大批量服务器安装操作系统的场景。

·     克隆安装是通过拷贝镜像文件去实现的,克隆安装可以减少用户在安装应用和驱动的时间。FIST会控制服务器进入iFIST,并通过iFIST给目标盘做好分区并将启动文件和操作系统文件拷贝到相应的分区。

 

说明

·     镜像安装和克隆可以指定操作系统的的安装盘,防止系统被安装到用户的数据盘,导致用户数据的丢失。

·     ks.cfg文件用于Linux系统的自动安装,在此文件中,可以配置用户名、密码等参数。Ks.cfg文件有一套详细的语法规范,详细请参考操作系统厂商提供的相关资料。

·     Unattend.xml文件用于Windows系统的自动安装,它的作用和ks.cfg相同。

·     克隆安装需要带内网络,需要FISTiFISTIP互通。

 

5. 固件安装

服务器配置模板支持选择固件基准,固件基准是指REPO LiveCD镜像,被应用模板的服务器将此镜像中的固件作为基准,如果服务器的硬件版本低于镜像文件中的版本,此功能可以帮助客户快速的将固件更新到基准中的版本。

6. 驱动安装

服务器配置模板支持驱动配置,驱动配置指的是用户在选择通过厂商镜像安装系统时,可以选择在安装操作系统后安装指定的驱动。驱动来源于用户上传的REPO包,在用户选择指定的REPO包后,FISTREPO挂载到KVM上,并控制FISTiFIST启动。iFIST启动后,将选择的驱动包拷贝到目标盘上,并在操作系统的安装完成后且第一次使用前这两个阶段中间自动插入了一个新的部署阶段,此阶段会自动执行相关的脚本,实现驱动的自动安装。

8.2.2  交换机配置模板

交换机配置模板指的是交换机的配置备份,FIST通过NETCONF接口导出交换机配置文件并保存在FIST服务端。FIST支持交换机模板的导出、导入以及删除操作。为了避免导入后的交换机管理IP发生冲突,FIST在导入时不会修改交换机管理口的IP配置。

8.2.3  机箱配置模板

FIST支持用户在机箱配置模板中给每一个机箱槽位单独关联服务器配置模板,进而可以对整个机箱一次性下发配置。在机箱配置模板中的服务器配置模板是和机箱槽位进行关联的,当这个槽位新插入一个刀片服务器后,FIST会将配置好的服务器配置模板下发到新插入的刀片服务器中去。

8.2.4  地址池

FIST支持配置IPv4地址池、IPv6地址池以及主机名池。地址池特性应用于大批量部署操作系统且需要配置静态IP以及主机名的使用场景。创建了地址池后,可以直接在服务器配置模板中选择配置好的主机名池、IPv4地址池或IPv6地址池,不用再手动去输入相关信息了,这样能极大地提升配置的效率。

8.2.5  网络

支持用户创建网络模板,网络模板支持配置端口的VLAN IDPVIDVLAN隧道以及网络的最大带宽。网络模板配合机架服务器使用,可以配置机架服务器业务口所连接的交换机端口的VLAN ID。如果系统流量的VLAN发生切换时,此功能和连接配置一起使用,可以快速的切换所连接网络端口的VLAN;网络模板配合机箱服务器使用,可以配置刀片服务器的业务口到互联模板整个网络通道的业务配置。

8.2.6  互联模块模板

互联模块指的是机箱内部的网络交换控制单元,为机箱中的刀片服务器提供数据交换功能,并集中对外提供数据端口,实现刀片服务器与外部网络的通信。FIST中支持配置互联模块上行端口的连接方式,连接方式指动态聚合、静态聚合以及主备的技术,同时支持选择网络模板。互联模块模板可以帮助用户打通刀片服务器、互联模块下行口以及上行口的网络通道,有效的解决网络隔离、阻塞、安全冗余等问题。

8.3  应用限制

驱动安装需要配合操作系统安装才能实现,且只有用户选择了通过操作系统镜像全新的安装方式才可支持。

组件更新

9.1  概念介绍

组件指服务器上的硬件(HDMBIOSCPLDRAIDNIC等)驱动和固件的统称。组件更新功能用于对服务器上的相关组件进行版本更新。当前可支持如下功能:

·     对用户上传的基准包(即REPO)进行清点,展示各组件的版本号以及基本信息。

·     自动比较基准包的组件版本和服务器上已经安装的组件版本,当基准包版本较高时,推荐用户安装。

·     支持降级、同版本更新以及升级。

远程组件更新的优点如下:

·     可定制,支持创建自定义基准,提高运维的灵活性和准确性。

·     批量更新,提高运维工作效率,降低运维成本。

·     覆盖多种使用场景,基本满足所有的用户需求。

9.2  机制介绍

FIST中包含多种组件更新的方式,包括组件更新、离线固件更新、HDM带外固件更新、自动驱动安装。

·     组件更新:组件更新有通过带外网络更新固件以及通过带内网络更新固或驱动的两种方式。带外的方式指的是FIST通过调用HDMRESTfulRedfish接口实现更新固件的功能,此功能需要配合HDMREPO一起使用。带外的方式依赖于HDM的实现,当前只支持更新HDMBIOS以及CPLD固件。此方式只需要FISTHDM的管理网络连接,可以和用户的业务网络完全隔离。对于无法使用HDM更新的硬件驱动和固件,带内的方式将完全覆盖这一场景。带内的方式需要配套FIST SMSREPO才能使用,因FIST SMS需要运行在用户的操作系统上,所以此模式需要FIST与用户的业务网络连接。FIST将用户选择的组件包通过TCP协议发送到用户的操作系统内,FIST SMS将会完成接下来的更新操作。

·     离线固件更新:离线固件更新用于服务器上未安装操作系统且带外固件更新功能无法完全覆盖需升级固件的场景,此功能需要FIST搭配REPO一起使用。FISTREPO镜像通过KVM挂载到需升级的服务器上,然后控制服务器从此镜像启动,REPO镜像启动后,将会自动调用升级脚本,完成固件升级过程。

·     HDM带外固件更新:HDM带外固件更新用于服务器当前业务不能立即重启并且只有带外网络可用的场景,此功能需要FIST搭配HDMiFISTREPO一起使用。FISTREPO镜像上传到HDM中进行保存,在服务器下次重启后,会先自动进入iFISTiFIST将会完成服务器的固件更新操作。

·     自动驱动安装:自动驱动安装指的是在通过FIST安装操作系统的同时安装所选择的驱动,此功能需要FIST配套iFISTREPO一起使用。自动驱动安装的详细内容请参考6. 驱动安装章节。

9.2.1  基准和基准清点

1. 添加基准

FIST支持从UNC路径、HTTP路径和本地路径添加基准,HTTP路径通过HTTP协议来通信,UNC路径通过SMB协议来通信,而本地基准就是FIST客户端所在的环境。

2. 清点基准

基准添加成功后即可对基准进行清点。清点基准是将基准文件从用户的添加路径拷贝到FIST的安装目录,并读取基准配置文件中的组件信息展示在页面上。组件信息包括组件的名称、组件的描述信息、组件的版本、可支持的升级方式(HDM或者FIST SMS),是否需要重启生效等。

3. 自定义基准库

FIST支持创建自定义基准。自定义基准首先需要用户添加一个标准的基准库,然后用户可选择过滤条件筛选出所需的组件,FIST会将用户选择的组件自动打包成一个自定义基准库。自定义基准库便于传输,提高运维工作的灵活性和准确性。除了FIST软件支持自定义基准库,用户还可以在supportrepo.h3c.com进行基准定制化。

4. 基准远程下载和升级

传统的固件管理的主体是服务器的管理员,用户定期或者当出现问题时主动向服务器供应商获取最新的固件。传统的方式有传递不及时且效率低下的风险。H3C基于服务器开发与运维经验,开发了服务器的云端版本管理系统即REPO远端系统,当版本发送更新后,主动推送固件和驱动给服务器运维软件FIST。配合FIST的“服务器配置模板”功能,可以及时更新最新的固件;配合“组件更新”功能,可以及时更新服务器的固件和驱动。此功能保护服务器无忧运行,可以有效提升机房管理效率,减少人力投入成本。

主要功能有支持配置REPO云端的地址、云端的网络连接状态、网络连接失败的解决建议、设置更新频率、显示最近一次更新的时间、更新状态、下载进度等。

图4 基准远程下载和升级

 

9.2.2  部署节点或同时部署多节点

节点即单台服务器,部署即给服务器的组件进行更新。FIST支持对节点进行升级,也支持同时对多节点进行升级。

·     FIST配套HDM可以进行带外的组件更新,可更新的组件包括HDMBIOS以及CPLD固件,支持设置部署生效时间以及是否包括配置升级。

·     FIST配套FIST SMS可以进行带内的组件更新,可更新的组件包括HDMBIOSCPLD固件以及各种Option卡、硬盘的驱动和固件。

·     FIST配套REPO可以进行离线的固件更新,可更新的组件包括HDMBIOSCPLD固件以及各种Option卡、硬盘的固件。

·     FIST配套HDMiFISTREPO可以进行HDM带外固件更新,可更新的组件包括各种Option卡、硬盘的固件。

·     服务器配置模板中的固件更新功能,可以实现对服务器的固件做更新,支持立即、定时以及循环更新功能。

·     服务器配置模板中系统配置功能,可以实现在对服务器安装操作系统后,自动安装用户选择的驱动。

·     如果FIST运行的环境也是台服务器,FIST同时支持对本地节点进行组件更新。

10  DHCP服务器

10.1  概念介绍

FIST通过实现了DHCPv4的相关协议集成了DHCP服务器的功能,用于为同一局域网内的服务器自动分配HDM管理IP地址或系统IP地址。该功能当前支持动态方式和静态方式两种分配方式。

·     动态方式:当客户端向DHCP服务器请求IP地址时,DHCP服务器从地址池中为客户端随机分配一个IP地址。

·     静态方式:通过DHCP服务器将IP地址与MAC地址绑定,当客户端向DHCP服务器请求IP地址时,DHCP服务器会检查客户端的MAC地址是否允许被分配,如果允许被分配则会将绑定的IP地址分配给客户端。

11  PXE服务器

11.1  概念介绍

PXE指的是Pre-boot eXecution Environment的缩写,它提供了一种使用网络的接口启动服务器的机制。FIST集成了PXE的服务端,用户可以使用此功能为服务器批量安装操作系统。FISTPXE服务器支持多种BootLoader配置,分别为PXELINUXGRUB2iPXE。同时,支持在安装RedHat Linux Enterprise以及CentOS镜像时自定义安装参数。

11.2  应用限制

PXE服务器,仅当FIST运行在AE模块时才支持。

12  软件推送安装

12.1  概念介绍

FIST支持批量向服务器的操作系统中推送软件,可以实现在系统下批量安装软件的功能。FISTWindows系统下通过WinRM技术,在Linux系统下通过SSH技术实现将软件传输到操作系统内,并执行相应的系统命令。同时,软件推送安装可以支持批量安装FIST SMS

用户可以按照模板要求的格式,自定义安装的软件和执行的脚本,可以实现在FIST页面批量获取服务器系统侧的一些信息,比如设备信息以及系统日志等。

13  其他功能

13.1  概念介绍

13.1.1  网络设置

FIST支持设置用户访问的IP、掩码以及网关。同时,为了方便FIST可以访问外部网络,FIST支持对接DNS以及Proxy服务器。

13.1.2  时间设置

FIST支持用户手动设置时间以及对接NTP时间服务器功能。该功能用于手动设置或者自动更新FIST所在环境的系统时间。


14  缩略语

常用词

说明

AE

APP EngineAPP引擎,机箱的特殊节点,FIST就运行在此节点中

BMC

Baseboard Management Controller,基板管理控制器,服务器的带外管理系统

BIOS

Basic Input Output System,基本输入输出系统

CPLD

Complex Programmable Logic Device,复杂可编程逻辑器件

CPU

Central Processing Unit,中央处理器

DHCP

Dynamic Host Configuration Protocol,动态主机配置协议,用于为网络设备动态地分配IP地址等网络配置参数

FIST

Fast Intelligent Scalable Toolkit,快速智能可扩展工具集。使用FIST可以快速灵活、智能的配置和使用服务器,如HDM配置、BIOS配置、固件更新、查看服务器信息等。同时,FIST具有可扩展性,用户可基于FIST开发自己的工具

FIST SMS

FIST System Management Service,配套FIST使用的服务器带内管理软件

GUI

Graphical User Interface,图形用户界面

HDM

Hardware Device Management,硬件设备管理,即H3C开发的BMC的别称

iFIST

Integrated Fast Intelligent Scalable Toolit,集成的快速智能可扩展工具集

IPMI

Intelligent Platform Management Interface,一种标准的硬件管理接口,通过HDM进行带外管理

OM

Onboard Manager,机箱的管理模块

OS

Operating System,操作系统

PXE

Preboot Execute Environment,预启动执行环境

RAID

Redundant Arrays of Independent Disks,独立磁盘冗余阵列

winRM

Windows Remote Managementwindows远程管理

DNS

Domain name resolution,域名解析

NTP

Network Time Protocol,网络时间协议

LDAP

 Lightweight Directory Access Protocol,轻型目录访问协议

SN

Serial Number,服务器的序列号

REPO

Repository,服务器固件和驱动的合集

SDS

Smart Diagnose System,服务器全生命周期的设备智能诊断系统

SSDP

Simple Service Discovery Protocol,简单服务发现协议

 

新华三官网
联系我们