Copyright © 2019 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
H3C公司研发的服务器管理软件——FIST,可以有效的帮助企业解决上述问题。FIST是一款可以对服务器进行批量配置的管理软件。企业客户可根据具体的实际需求对服务器进行灵活的配置部署,从而打造自己专属的运维环境。FIST能有效帮助企业提高运维效率,降低运维成本。
其主要特性有:
· 跨平台支持
提供单个软件版本支持多种运行环境,包括Windows、Linux等。软件轻量易安装,简化运维人员的部署难度。
· 服务器的批量部署
提供对服务器批量部署的支持,能够大大提升服务器上线前的部署效率。
· 模板化配置支持
提供了对服务器配置模板化的支持,支持配置的导入导出,达到将服务器配置和硬件分离的效果,提供无状态计算的功能。
· 开放集成能力
提供基于HTTPS/HTTP协议的RESTful接口,支持第三方厂商将FIST管理系统集成到客户的业务流程中。
图1 系统框架
H3C FIST可以部署在各种复杂的业务环境中,帮助用户对IT资源进行监控和管理。使用FIST可以大大减少服务器上线前的配置复杂度、可以全方位的监控运行中的服务器监控状态,从而提供了服务器全生命周期的管理。同时FIST提供了RESTful API接口,方便与第三方系统进行对接。
图2 典型组网
· FIST客户端:通过浏览器访问FIST的PC机、虚拟机或者服务器。
· FIST服务器:安装了FIST的PC机、虚拟机或者服务器(FIST仅支持在已安装操作系统的PC机、虚拟机或服务器上运行)。
· 用户可以通过FIST客户端或FIST服务器上的浏览器访问FIST,并通过FIST来管理设备。
· FIST通过带外管理网络和服务器的HDM通信,实现对服务器的带外管理。
· FIST可以配合FIST SMS实现对服务器的带内管理,FIST SMS需要运行在系统环境中,实现对服务器的带内管理。
FIST提供了覆盖机架服务器、刀片服务器、网络设备以及机箱等多种设备的统一维护和管理,包括设备的搜索与添加、状态实时监控、告警日志查看、远程跳转HDM,覆盖了设备发现、配置、监控、远程管理多方面资源管理。如图3所示。
· 资源添加:支持添加H3C机架服务器、刀片服务器、机箱以及网络设备。
· 资源监控:支持对硬盘、内存、CPU、网卡等进行状态监控。
· 告警监控:支持对H3C自研服务器的告警监控。
· 远程跳转:跳转到服务器的HDM管理界面。
支持通过设备添加(单台或批量)和设备发现(IP段搜索)功能添加服务器设备。
添加方式:
· 单台添加:通过IP地址、端口、设备用户名和密码添加设备,如图4所示。
· 批量添加:导入设备文件列表添加设备。通过上传txt、xls以及xlsx格式的设备文件,批量添加设备。支持设备文件的模板下载,如图4所示。
· 设备发现:输入起始IP地址、结束IP地址及设备用户名和密码,FIST可以自动搜索到设备,从而可以勾选设备进行添加,如图5所示。
支持添加的设备类型有:
· HDM:H3C服务器。
· FIST SMS:安装并运行FIST SMS的所有服务器。
在设备管理页面可以查看到设备信息,如图6所示。基础信息获取分为:
· HDM设备:HDM状态、HDM版本、BIOS版本、BIOS启动项、启动模式、设备的总体健康状态、产品名称、内存信息、物理硬盘信息、CPU信息。FIST通过HDM的RESTful接口、IPMI命令等协议获取上述信息。
· FIST SMS设备:FIST SMS状态、HDM可获取的信息、网络信息以及服务器关键硬件的性能监控。性能监控包括CPU利用率、内存利用率、磁盘利用率以及网络吞吐量。FIST通过带内的IPMI命令以及系统侧的接口获取上述信息。
FIST通过调用HDM的RESTful接口集成部分HDM功能,支持的功能有:
· 免登陆跳转HDM界面。
· 查看服务器的健康状态以及温度海洋图。
· 查看服务器的存储信息。
· 查看服务器的PCIe卡的信息。
· 打开KVM远程控制台。
· 远程控制服务器电源。
· 远程控制服务器的UID灯。
FIST支持通过交换机的IP、用户名以及密码添加交换机。
此功能只有当FIST运行在AE环境中才会存在。
当交换机被FIST管理之后,FIST可以通过交换机提供的接口和交换机完成信息交互,如图7所示。FIST支持查看交换机的基本信息,包括:
· 交换机的概述信息,包含制造商、型号等,如图8所示。
· 交换机的单板信息,包含槽位号、CPU和内存使用率等,如图9所示。
· 交换机的端口信息,包括各端口的名称、流量信息等,如图10所示。
· 交换机的接口信息,包括各接口的名称以及状态等,如图11所示。
FIST页面可以远程获取交换机端口的流量统计信息,如图12所示。流量统计信息包括:
· 接受/发送的字节数。
· 接受/发送的单播包数。
· 接受/发送的非单播包数。
· 接受/发送的丢弃包数。
· 接受/发送的错误包数。
· 接受/发送的字节速率。
· 接受的不支持包数。
通过FIST可以打开交换机的SSH控制台,用户可以在控制台界面输入用户名和密码进入操作环境,从而可以远程操作交换机,如图13所示。
图13 交换机的SSH控制台
用户可以通过添加OM的IP、用户名和密码将整个刀箱设备纳入FIST的管理。当FIST运行在某台刀箱的AE环境中,会自动将此刀箱纳入管理。FIST对刀箱的管理包括:
· 管理刀箱的OM模块,本功能可以查看刀箱OM模块的基本信息以及完成简单的操作。
· 管理APP Engine模块,FIST运行在此模块的OS环境中,支持查看此模块的基本信息以及完成简单的操作。
· 管理计算节点,包括获取基本信息以及支持机架服务器的所有部署功能。
· 管理互联模板,支持获取互联模块的基本信息。
· 管理电源/风扇系统,用户可通过FIST完成对整个电源/风扇系统的监控与配置。
· 查看刀箱的系统日志,本功能可查看和导出机箱的系统日志,系统日志将记录刀箱发生的所有事件的信息,比如OM的登录日志、OM网络端口的UP/DOWN日志等。
· 查看计算节点的事件日志,此功能汇总当前刀箱所有计算节点的事件日志,方便用户查看。事件日志包括关键传感器的告警信息。
此功能只有当FIST运行在AE环境中才会存在。
图14 刀箱的典型组网
在刀箱的管理首页可以看到刀箱的前/后视图以及刀箱各模块的健康信息。FIST通过调用OM的相关接口获取这些信息,用户可以通过这些信息大体了解机箱的运行状态,做到对机箱的远程管理与监控,如下图所示。
图15 刀箱的前后视图
图16 刀箱的子系统状态
刀箱的管理模块即刀箱上的管理板,H3C称之为OM模块。FIST通过RESTful接口可以和OM模块进行信息交互,从而完成对刀箱管理的大部分功能。通过FIST可以了解OM模块基本的运行信息,包括状态、槽位号、CPU使用率等,如图17所示。
图17 OM模块的基本信息
刀箱有一个特殊的节点,FIST就运行在这个节点中,H3C将这个节点称为App Engine模块。通过FIST以及刀箱的OM模块可以完成刀箱的所有管理需求。当前对此模块可以实现如下功能:
· 支持获取AE引擎的基本信息,比如健康状态,电源状态,功率,温度、CPU/内存的基础信息等。
· 支持AE引擎的简单操作,如UID灯控制、电源控制、打开KVM控制台等
计算节点作为刀箱上的最重要组成部分,FIST不仅可以通过OM模块获取计算节点的基础信息以及完成基础操作,而且FIST可以对计算节点完成和机架服务器相同的部署操作,如图18所示。当前可以实现以下功能:
· 支持查看计算节点的基本信息,比如健康状态,电源状态,功率,温度、CPU/内存的基础信息,节点间的互联关系等。
· 支持计算节点的简单操作,如UID灯控制、电源控制、一次性启动项设置、打开远程控制台等。
· 支持HDM配置、RAID配置、监控告警以及Profile功能等机架服务器支持的部署功能。
FIST通过调用OM的相关接口,获取互联模块的基础信息。当前支持获取健康状态,电源状态以及CPU使用率,如图19所示。
电源和风扇模块涉及到刀箱的两个重要属性——功耗以及散热。FIST页面提供了对刀箱风扇以及电源系统的基本信息的查看以及配置。FIST通过RESTful接口与OM模块完成电源和风扇系统的信息交互,基本可满足用户的日常使用需要。当前可以实现以下功能:
· 获取电源系统的基础信息,包括电源在位信息、状态信息、功率等,如图20所示。
· 获取风扇系统的基础信息,包括风扇在位信息、状态信息、转速等,如图21所示。
· 获取刀箱当前的功率信息,包括刀箱整体功率信息以及各模块的功率信息等,如图22所示。
· 查看刀箱的历史功率图,可以筛选查看对象以及时间范围,如图23所示。
· 设置电源的工作模式,包括电源冗余模式以及智能电源模式,如图24所示。
· 设置刀箱的功率限额,包括对单独的刀箱设置功率限额以及对多个刀箱设置一个总的功率限额,如图25所示。当对整个刀箱设置一个功率限额时,首先FIST会给每个刀箱分配一个最低的功率,然后将剩下的功率按照刀箱当前使用功率的比例分配给每一个刀箱。
图26 查看刀箱的系统日志
图27 查看计算节点的事件日志
FIST通过实现了DHCPv4的相关协议集成了DHCP服务器的功能,用于为同一局域网内的客户端自动分配HDM管理IP地址或系统IP地址。用户可以操作DHCP服务器,通过动态方式和静态方式为客户端分配IP地址。
· 动态方式:当客户端向DHCP服务器请求IP地址时,DHCP服务器从地址池中为客户端随机分配一个IP地址,如图28所示。
· 静态方式:通过DHCP服务器将IP地址与MAC地址绑定,当客户端向DHCP服务器请求IP地址时,DHCP服务器会将绑定的IP地址分配给客户端,如图29所示。
图28 DHCP动态配置方式
图29 DHCP静态配置方式
FIST支持HDM以及BIOS配置的配置复制,典型的应用场景是客户需要将大批量服务器的HDM/BIOS配置成某一种或者某几种配置。首先用户可以选择一台服务器,手动将HDM/BIOS配置成目标配置,接着可以将此台服务器的配置作为模板进行导出,然后将此模板批量导入到其他服务器中去。此功能可以实现服务器上线前的大批量配置,不仅仅减少了大量的运维成本,且大大降低了人为可能出现的失误。
HDM/BIOS配置管理的特点:
· 一键导出,操作简单方便。
· 批量复制,简化服务器HDM/BIOS配置管理。
· 带外环境,与客户业务环境分开。
图30 HDM/BIOS配置序列图
图31 HDM/BIOS配置典型组网
该功能用于批量创建、删除逻辑盘、查看物理盘、逻辑盘、阵列卡的基本信息。本功能通过FIST控制服务器进入iFIST环境,然后通过iFIST的相关接口进行RAID的配置部署。如果被管理服务器安装了相同型号的阵列控制卡,则支持为这些服务器批量进行RAID配置,如果安装了不同型号的阵列控制卡,则可以在一个页面单独对每台设备进行RAID配置。
在服务器上可以通过多种方式配置RAID管理,不限于通过BIOS、系统内厂商工具进行配置。不过在实际配置中,为避免冲突,建议不要同时使用多种方式进行RAID管理配置。
图32 RAID配置序列图
RAID配置的原理如图33所示。
图34 RAID配置典型组网
组件更新功能用于对服务器上的各种驱动(各种Option卡的驱动)和固件(BMC、BIOS、CPLD等)进行更新。当前可支持如下功能:
· 对用户上传的基准包进行清点,展示各组件的版本以及基本信息。
· 自动比较基准包的组件版本和服务器上已经安装的组件版本,当基准包版本较高时,可推荐安装。
· 支持降级、同版本更新以及升级。
远程组件更新的优点如下:
· 可定制,支持创建自定义基准,提高运维工作的灵活性和准确性。
· 批量更新,提高运维工作效率,降低运维成本。
· 远程更新,降低运维工作的人力物力成本。
图35 组件更新原理图
图36 更新HDM、BIOS、CPLD固件典型组网
HDM、BIOS、CPLD可以通过HDM或者FIST SMS进行升级,如果带内、带外网络同时连接的时候,优先使用HDM进行升级。
图37 更新非HDM、BIOS、CPLD固件典型组网
基准即服务器硬件固件和驱动的集合。FIST支持从UNC路径、HTTP路径和本地路径添加基准,HTTP路径通过HTTP协议来通信,UNC路径通过SMB协议来通信,而本地基准就是FIST运行环境本地的路径。
基准添加成功后即可对基准进行清点。清点基准是将基准文件从用户的添加路径拷贝到FIST的安装目录,并读取基准配置文件中的组件信息展示在页面上。组件信息包括组件的名称、组件的描述信息、组件的版本、可支持的升级方式(HDM或者FIST SMS),是否需要重启生效等。
FIST支持创建自定义基准。自定义基准首先需要用户添加一个标准的基准库,然后用户可选择过滤条件筛选出所需的组件,FIST会将用户选择的组件自动打包成一个自定义基准库。自定义基准库便于传输,提高运维工作的灵活性和准确性。
节点即单台服务器,节点组即服务器的集合,部署即给选择的服务器的组件进行更新。FIST支持对节点进行升级,也支持同时对节点组进行升级。
· FIST配套HDM可以进行带外的组件更新,可更新的组件包括BMC、BIOS以及CPLD。
· FIST配套FIST SMS可以进行带内的组件更新,可更新的组件包括BMC、BIOS、CPLD以及各种Option卡的驱动和固件。
· 如果FIST运行的环境也是台服务器如AE环境,FIST同时支持对本地的服务器进行组件更新。
当服务器被添加到FIST中,即表示当前这台服务器接受FIST的管理和监控。FIST可以通过调用HDM的RESTful接口、IPMI命令等方式去获取HDM的相关状态信息,这些状态信息包括服务器的整体健康状态、电源状态、UID灯状态、温度海洋以及各关键硬件的健康信息,如下图所示。
服务器整体的健康状态以及电源状态可通过HDM或者FIST SMS获取,其他信息只能通过HDM进行获取。
图38 服务器首页的状态
图39 服务器详细的健康状态
FIST可以配套FIST SMS获取服务器系统侧的性能信息,FIST每经过一段时间向FIST SMS获取一次性能指标,FIST SMS通过系统侧的一些接口获取相关的信息。性能监控包括CPU利用率、内存利用率、磁盘利用率以及网络吞吐量,如图40所示。
FIST实现了SMTP管理的功能,可以通过此功能实现服务器故障的自动上报。FIST可以通过某个端口监听所有被管理服务器的SNMP trap信息。待FIST接受到trap信息之后,可以通过内置的邮件服务器,将一定格式的告警数据通过邮件发送给目标邮件地址,如图41所示。具体可实现:
· 将服务器产生的事件日志通过“电子邮件警告”发送给指定的用户。
· 监控服务器的健康状态,当服务器的健康状态发生变化时,将变化信息通过“电子邮件警告”发送给指定用户。
· 可以设置告警过滤级别。
· 可以设置接受邮件的地址,上限4个。
图42 典型组网
FIST支持下载、导入和查看SDS日志,通过解析SDS日志以了解服务器的运行状况,如图43所示。SDS日志包括事件日志和存储日志。FIST提供的日志解析功能降低了SDS日志对HDM环境和现场环境的依赖性,方便了日志解析,极大地提高了运维效率。
FIST SDS功能包括:
· 事件日志:查看HDM、BIOS以及OS上报的服务器的日志信息。
· 存储日志:查看RAID卡、HBA卡的配置以及Debug信息。
· 可远程批量下载服务器的SDS日志。
· 可导入本地的SDS日志。
图43 SDS日志解析
Profile功能即服务器的模板配置功能。通过Profile功能,可以将服务器的硬件和相关配置分开,从而实现服务器的无状态配置。用户可以通过新建Profile文件,去创建一个抽象的服务器配置属性。当新设备上线前,我们可以通过将Profile文件和这台设备绑定,实现自动的将Profile中的配置下发到服务器中去,做到快速上线的效果。当服务器出现故障后,我们可以将之前保存的Profile文件重新绑定到新设备中去,这样可以做到配置的快速迁移,实现快速更换设备的效果。
Profile功能需要通过FIST和iFIST配合完成,FIST通过带内网络和iFIST进行通信,并将相关的配置信息下发到iFIST,iFIST根据配置完成最后的操作。
当前可以配置的功能有:
· HDM/BIOS配置
· RAID配置
· OS自动安装
· 驱动的自动安装
HDM\BIOS配置不需要进入iFIST,只需要FIST和HDM建立连接即可,详情请参考3.5.1 HDM/BIOS配置管理。在Profile功能中,用户只需要选择3.5.1 HDM/BIOS配置管理功能中导出的配置文件。HDM\BIOS配置的时序图以及典型组网图请参考3.5.1 HDM/BIOS配置管理。
图44 Profile功能的时序图
图45 Profile功能的典型组网
用户可以在Profile功能中选择HDM配置和BIOS配置的模板,如图46所示。HDM配置和BIOS配置的模板需要用户使用3.5.1 HDM/BIOS配置管理功能从一台配置好的服务器中导出。
图46 HDM/BIOS配置模板
RAID配置功能通过调用厂商提供的API接口完成创建RAID、删除RAID、指定RAID名称、指定RAID级别以及一键创建RAID0功能,如3.8.2 图47所示。一键创建RAID0功能即是将每一个未组RAID的裸盘单独组一个逻辑盘。
图47 RAID配置模板
用户需要将本地的镜像源上传到FIST服务器接受管理,如图48所示。只有FIST服务端的镜像才可以作为OS安装的镜像源。
图48 上传OS镜像
通过Profile功能可以完成操作系统的自动安装。首先用户需要在Profile配置文件中按需定义OS的一些参数配置,FIST在和iFIST建立连接之后,将这些配置发送给了iFIST,最后的安装由iFIST完成。FIST会调用相关的接口,自动将用户选择的镜像批量挂载到需要安装的服务器上。操作系统的自动安装是通过定制操作系统的自动安装脚本去实现的,比如Linux需要根据配置定制ks.cfg文件,windows需要根据配置定制Unattend.xml完成。当前Profile功能可以完成主流操作系统的自动安装。
自动安装OS功能可以指定操作系统的的安装盘,防止系统被安装到用户的数据盘,导致用户数据的丢失。
ks.cfg文件用于Linux系统的自动安装,在此文件中,可以配置用户名、密码等参数。Ks.cfg文件的有一套详细的语法规范,详细请参考操作系统厂商提供的相关资料。
Unattend.xml文件用于Windows系统的自动安装,它的作用和ks.cfg相同。
图49 OS配置模板1
图50 OS配置模板2
Profile功能可以在操作系统安装完毕之后,自动在操作系统上安装所需的驱动。驱动的安装源即为用户上传的基准包,FIST首先会自动在基准包中筛选出适合操作系统的组件包,用户可以在筛选结果中自由选择需要安装的组件包。在应用Profile文件时,如果用户选择了自动安装驱动,则FIST将会将基准包自动挂载到所选择的节点(可以是多个)上,iFIST会将用户选择的驱动拷贝到操作系统的安装盘上,并指定自动安装文件(ks.cfg等)在安装成功后,自动安装选择的驱动,如图51所示。
通过上面的步骤,用户可以创建一个Profile模板文件,但是当前这个模板文件还没有生效。用户可以选择某些设备,选择Profile文件中的所有或者部分配置并使其生效,如图52所示。
FIST提供了大屏展示的功能,满足部分客户对于 超大屏幕显示的需求,此功能显示了被FIST管理设备的重要信息,便于用户对整个IT环境进行集中运维、监控以及汇报。
此功能只有当FIST运行在AE环境中才会存在。
此功能可实现的功能包括:
· 服务器、网络设备、机箱的健康状态。
· 设备的整体使用情况,比如上电/下电个数以及刀箱相关槽位的使用情况。
· 当前IT系统的计算能力的汇总信息,包括CPU总核数以及内存的总大小。
· FIST所在刀箱的历史功率图。
FIST | Fast Intelligent Scalable Toolkit | 快速智能可扩展工具集 |
AE | APP Engine | APP引擎,刀箱的特殊节点,FIST就运行在此节点中。 |
OM | Onboard Manager | 刀箱的管理模块 |
BMC | Baseboard Management Controller | 基板管理控制器 |
HDM | H3C Device Management | H3C的BMC |
iFIST | Integrated Fast Intelligent Scalable Toolit | 集成的快速智能可扩展工具集 |
FIST SMS | FIST System Management Service | 配套FIST使用的带内管理工具 |