• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

H3C SeerEngine-DC 全景运维地图安装指导-E73xx-5W302

01-正文

本章节下载 01-正文  (1.55 MB)

01-正文

目 

1 概述

2 安装流程

3 安装前的准备工作

3.1 软硬件配置需求

3.1.1 硬件配置要求

3.1.2 操作系统要求

3.1.3 客户端配置要求

3.2 获取软件包

3.3 验证软件包

4 安装规划

4.1 磁盘分区规划

4.2 网络规划

5 安装操作系统及依赖包

6 安装Matrix

6.1 上传Matrix软件安装包

6.2 修改配置文件(非root用户需要配置)

6.3 安装Matrix

6.4 SSH配置(可选)

6.4.1 修改SSH服务端口号

6.4.2 密钥登录

7 部署统一数字底盘

7.1 部署前的检查

7.2 创建Matrix集群

7.2.1 登录Matrix

7.2.2 配置集群参数

7.2.3 创建集群

7.3 部署统一数字底盘Base应用包

8 部署全景运维地图组件

8.1 登录Matrix

8.2 上传安装包

8.3 应用选择

8.4 安装包选择

8.5 资源配置

8.6 参数配置

9 登录全景运维地图组件

10 软件注册

10.1 在License Server上安装授权

10.2 获取License授权

11 备份恢复

12 软件升级及卸载

12.1 升级全景运维地图组件

12.2 卸载全景运维地图组件

13 常见问题解答

13.1 Matrix常见问题解答

13.1.1 如何配置Matrix集群主老化时间?

13.1.2 扩容Matrix时若在ETCDINSTALL阶段停留时间过长怎么办?

13.1.3 Matrix安装完成后,页面无法访问怎么办?

13.1.4 在Matrix中添加节点失败怎么办?

13.1.5 Matrix部署失败时应该执行什么操作?

13.1.6 Matrix如何切换双栈?

13.1.7 如何在Matrix页面开启统一数字底盘组件应用服务?

13.2 浏览器常见问题解答

13.2.1 如何通过映射IP访问Matrix页面?

 


1 概述

SeerEngine-Digitalmap是一款为数据中心设计的组件,以下称之为全景运维地图组件。其主要目标是在数字化转型背景下,帮助各行业应对由于数据中心规模扩大和网络复杂度提升带来的运维挑战。传统的数据中心缺乏统一的网络健康监测视图,导致故障定位困难、恢复效率低下和用户投诉频发,从而阻碍了数字化转型的进程。网络全景运维地图解决方案通过打破数据孤岛,实现计算、网络与应用的协同管理和统一运维。借鉴交通导航地图的模式,它提供了“一图可视全网,故障一秒定位,三方无缝对接”等功能,使运维人员能够快速识别和解决问题,协助企业顺利推进数字化转型。

主要特点如下:

·     全网一图可视。

·     端到端路径导航,故障快速定位。

·     无缝集成第三方设备或者第三方系统。

·     多站点数据采集,应用网络互视。

 

 

 


2 安装流程

全景运维地图组件可在Matrix融合部署页面进行安装。具体安装流程如下。

表2-1 安装流程

步骤

具体操作

说明

准备服务器

根据组网需求,准备1台或3台服务器

必选

硬件和软件需求请参见“软硬件配置需求

获取安装包

根据实际功能需求、硬件配置以及资源档位关系,选择安装对应的组件及依赖的应用

必选

安装包说明请参见“获取软件包

磁盘分区规划

与数据中心控制组件融合部署时,可根据数据中心控制组件的磁盘分区要求进行分区。具体细节请参见资源计算工具

必选

网络规划

全景运维地图组件不需要额外增加网络,复用北向网络即可

可选

安装操作系统及依赖包

在服务器上安装操作系统

必选

请参见“安装操作系统及依赖包

部署Matrix集群

部署Matrix

必选

请参见“安装Matrix

部署统一数字底盘

·     部署前的检查

·     创建Matrix集群

·     部署Base必选应用包

必选

请参见“部署统一数字底盘

部署全景运维地图组件及其依赖的组件

登录Matrix

必选

上传安装包

必选

请在融合部署页面,将统一数字底盘可选包、U-Center 5.0、数据中心控制组件、全景运维地图组件等上传并部署

应用选择

必选

安装包选择

必选

资源配置

必选

参数配置

必选

 

 


3 安装前的准备工作

3.1  软硬件配置需求

3.1.1  硬件配置要求

全景运维地图组件支持单机和集群部署,推荐3机集群部署模式。

全景运维地图组件的硬件配置需求请参考资源计算工具

3.1.2  操作系统要求

全景运维地图组件运行在统一数字底盘上,部署全景运维地图组件前需要先安装统一数字底盘。操作系统的支持情况请参见《H3C 统一数字底盘部署指导》。不同CPU的推荐操作系统如下表所示。

表3-1 不同CPU的推荐操作系统

CPU

推荐操作系统

x86-64(Intel64/AMD64)

磐宁NingOS

x86-64海光

TencentOS 3.1

ARM鲲鹏

TencentOS 3.1

ARM飞腾

TencentOS 3.1

 

表3-2 操作系统检测项

检测项

检测标准

NTP检查

请检查系统时间已配置完成,建议配置NTP时间同步,整网使用统一的时钟源同步时间

服务器和操作系统兼容性

请参见以下链接,查看H3C服务器和操作系统的兼容性列表:

http://www.h3c.com/cn/home/qr/default.htm?id=367

 

3.1.3  客户端配置要求

用户不需要安装客户端软件,使用浏览器即可访问统一数字底盘。推荐使用的浏览器为Google Chrome 96及以上版本。

3.2  获取软件包

在部署全景运维地图环境时,除了全景运维地图组件外,还需要其他支持组件,具体请参见下表。

在部署过程中,请根据实际需求选择合适的组件,以确保功能的完整性和高效运作。

表3-3 全景运维地图功能依赖的组件说明

名称

说明

必选/可选

全景运维地图组件

SeerEngine_Digitalmap-version-MATRIX.zip

提供数据中心全景运维地图功能

必选

统一数字底盘

UDTP_Base_version_platform.zip

基础服务组件:提供融合部署、用户管理、权限管理、资源管理、租户管理、菜单管理、日志中心、备份恢复和健康检查等基础功能

必选

BMP_Common_version_platform.zip

通用服务组件:提供大屏管理、告警、告警聚合和告警订阅等功能

必选

BMP_Connect_version__platform.zip

连接服务组件:提供上下级站点管理、WebSocket通道管理和NETCONF通道管理功能

可选

BMP_Extension_version_platform.zip

扩展服务组件:提供异地容灾、快照回滚、证书服务、自监控、智能算法库、单点登录和密码平台等功能

可选

BMP_UCP_BasePlat_version_platform.zip

UCP基础平台组件:提供U-Center公共平台组件服务(ETCD、运维域菜单注册、可视化组件)

必选

BMP_UCP_CollectPlat_version_platform.zip

UCP采集平台组件:提供模板、挂牌、采集平台、统一资源、资源发现、文件传输服务

必选

BMP_CMDB_version_platform.zip

配置管理数据库

必选

NSM

NSM_RES_version_platform.zip

网络设备的纳管和基本信息管理

必选

NSM_PERF_version_platform.zip

网络设备性能监控和展示

必选

NSM_TOPO_version_platform.zip

网络拓扑展示

必选

IOM

U-Center_IOM_version_platform.zip

IOM服务、JAVA采集器

在全景运维地图中,提供纳管服务器上的OVS主机等功能

可选

数据中心场景组件

SeerEngine_DC-version-MATRIX.zip

数据中心控制组件

必选

SeerEngine_DC-version-AIDCAgent-platform.zip

采集服务器GPU信息

可选

说明

·     NSM组件所需的硬件配置和具体部署步骤请参见《H3C NSM 安装部署指导》。

·     U-Center组件所需的硬件配置和具体部署步骤请参见《H3C U-Center 5.0部署指导》。

·     数据中心场景组件需的硬件配置和具体部署步骤请参见对应的安装部署手册

 

3.3  验证软件包

上传应用安装包之后,请参见如下命令对软件包执行MD5验证,确保软件包的完整性和正确性。

(1)     查看已上传的安装包。

[root@node1~]# cd /opt/matrix/app/install/packages/

[root@node1~]# ls

BMP_Common_E7301_x86.zip           BMP_Connect_E7301_x86.zip

…略…

(2)     查看安装包的MD5值,以UDTP_Base_E7301_x86.zip为例。

[root@node1~]# md5sum UDTP_Base_E7301_x86.zip

652845e0b92bbdff675c7598430687e2  UDTP_Base_E7301_x86.zip

(3)     将上述步骤中获取到的MD5值与发布的软件版本文件MD5值进行比对,若一致,则软件包正确。


4 安装规划

4.1  磁盘分区规划

与数据中心控制组件融合部署时,可根据数据中心控制组件的磁盘分区要求进行分区。具体细节请参见资源计算工具,请勿使用自动分区。

4.2  网络规划

全景运维地图组件不需要额外增加网络。在与控制组件进行融合部署时,共享同一个北向网络。

图4-1 与控制组件融合部署时的组网规划

 

表4-1 网络说明

网络名称

说明

容器网络

控制组件集群间微服务通信的网络,用于集群系统的内部通信,容器网络的IP对外部不可见

南向网络

用于控制组件和南向设备进行通信,运行NETCONF、SNMP、OpenFlow等南向协议,控制组件的南向虚IP落在南向网络中,也可以称为南向设备管理网络

北向网络

用于用户登录宿主机、控制组件的Web页面访问和云平台对接等,控制组件的北向虚IP落在北向网络中,也称为宿主机管理网络

 



6 安装Matrix

6.1  上传Matrix软件安装包

(1)     获取软件安装包,并将软件包拷贝至服务器的待安装目录下,或使用FTP等文件传输协议将软件包上传到指定目录。

¡     (推荐)root用户在/root目录下,或在/root下创建目录。

¡     (推荐)非root用户(如admin)在/home/admin下。

说明

如果需要使用FTP、TFTP协议上传下载,请选择binary模式(二进制模式)传输,以免损坏软件包。

 

(2)     上传完成后,请参考验证软件包对Matrix的安装包进行MD5校验。

6.2  修改配置文件(非root用户需要配置)

若使用root用户安装软件包,或者使用admin用户安装NingOS操作系统,可直接跳过该章节。

(1)     执行su root命令切换为root用户后,在root用户下确认/etc/passwd配置文件。已配置的非root用户名称是否与配置文件中的名称一致,此处以user为例,如下图所示。如果不一致请修改配置文件中的用户名,其他参数无需修改,保持默认设置即可。

[root@node1 ~]# vim /etc/passwd

user:x:1000:1001:user:/home/user:/bin/bash

(2)     在root用户下修改/etc/sudoers配置文件。

[root@node1 ~]# vim  /etc/sudoers

…略…

## Allow root to run any commands anywhere

root    ALL=(ALL)       ALL

user    ALL=(root)       NOPASSWD:/bin/bash

 

## Allows members of the 'sys' group to run networking, software,

## service management apps and more.

# %sys ALL = NETWORKING, SOFTWARE, SERVICES, STORAGE, DELEGATING, PROCESSES, LOCATE, DRIVERS

 

## Allows people in group wheel to run all commands

%wheel  ALL=(ALL)       ALL

user    ALL=(root)       NOPASSWD:/bin/bash

user    ALL=(root)       NOPASSWD:/usr/bin/rpm,/bin/sh

…略…

 

(3)     在root用户下修改/etc/pam.d/login配置文件。

[root@node1 ~]# vim /etc/pam.d/login

#%PAM-1.0

auth       substack     system-auth

auth     [user_unknown=ignore success=ok ignore=ignore auth_err=die default=bad] pam_securetty.so

…略…

(4)     在root用户下修改/etc/ssh/sshd_config配置文件。

注意

若当前环境为统一数字底盘与PolarDB数据库的融合部署,请勿执行此步骤。

 

[root@node1 ~]# vim /etc/ssh/sshd_config

…略…

#LoginGraceTime 2m

PermitRootLogin no

…略…

(5)     修改完成后,执行systemctl restart sshd命令重启sshd服务。

6.3  安装Matrix

说明

所有节点的安装用户需保持一致,若选择非root作为安装用户,需要在脚本执行命令前添加sudo /bin/bash指令。

 

(1)     进入Matrix软件包(.zip文件)的存放路径,安装Matrix。软件包的名称格式为UDTP_Matrix_version_platform.zip,其中version为版本号,platform为CPU架构类型。下面以root用户、x86_64版本为例进行安装。

[root@node1 ~]# unzip UDTP_Matrix_E7301_x86_64.zip

[root@node1 ~]# cd UDTP_Matrix_E7301_x86_64

[root@node1 UDTP_Matrix_E7301_x86_64]# ./install.sh

…略…

Complete!

(2)     通过命令systemctl status matrix验证Matrix服务是否安装成功。若安装成功,则将在Active字段后显示运行信息为active (running)。剩余节点执行同样操作即可。

(3)     默认为中文界面,若需英文界面,则可通过如下方式修改:

a.     使用vim /opt/matrix/config/navigator_config.json命令进入navigator_config文件,修改defaultLanguage字段值为en(若文件中没有该配置,请直接增加该字段,字段后需要携带英文逗号),配置如下:

[root@node4 ~]#  vim /opt/matrix/config/navigator_config.json

{

"defaultLanguage":"en",

"productName": "uc",

"pageList": ["SYS_CONFIG", "DEPLOY", "APP_DEPLOY"],

"defaultPackages": [],

"allowDeployedPackageIds": ["UNIFIED-PLATFORM-BASE"],

"url": "http:””://${vip}:30000/central/index.html#/ucenter-deploy",

"theme":"darkblue",

"matrixLeaderLeaseDuration": 30,

"matrixLeaderRetryPeriod": 2,

"sshPort": 22,

"sshLoginMode": "secret",

"features":{"stopNtpServerBeyondThreshold":"false"}

}

b.     执行systemctl restart matrix命令重启Matrix服务使生效配置,其他节点也依次按a、b步骤配置。

6.4  SSH配置(可选)

6.4.1  修改SSH服务端口号

Matrix集群通过SSH连接进行节点的安装、升级、修复等操作,并实现应用部署、监控等功能。各节点上的SSH服务器默认使用22号端口侦听客户端连接请求,双方建立TCP连接后可进行数据信息的交互。

用户可根据本章节修改SSH服务端口号,提高SSH连接的安全性。

注意

·     请确保所有节点都配置为相同的SSH服务端口号。

·     端口范围为1~65535,不推荐使用1~1024之间的知名端口号,禁止使用各方案端口矩阵中已定义的端口号,否则SSH服务可能启动失败。

·     若需要通过ISO方式升级Matrix,请在升级前确保集群中所有节点的navigator_config文件内容一致。可使用vim /opt/matrix/config/navigator_config.json命令进入navigator_config文件,查看该文件中的详细信息。

·     若修改已部署集群中的SSH服务端口号,请确认所有业务组件是否支持。

·     若为非root用户,执行如下命令前,请进行提权操作(在非root用户下执行su root命令即可)。

·     集群各节点/opt/matrix/config/navigator_config.json中的配置必须保持一致,否则会影响集群稳定性。

·     若需修改SSH服务端口号,请参见各产品版本使用指导书中的产品端口占用说明,以避免端口冲突。

 

1. 修改各节点所在服务器的SSH服务端口号

(1)     若集群未部署,登录节点后台,使用netstat -anp | grep after_port-number检查指定的端口号是否被占用,若未被占用,则无返回信息;若被占用,则返回如下信息。其中,after_port-number为用户想要指定的SSH服务新的端口号。举例如下:

¡     12345端口号未被占用,可以修改为该端口号。

[root@node1 ~]# netstat -anp | grep 12345

¡     1234端口号被占用,不可以修改为该端口号。

[root@node1 ~]# netstat -anp | grep 1234

tcp        0      0 0.0.0.0:1234            0.0.0.0:*               LISTEN      26211/sshd

tcp6       0      0 :::1234                 :::*                    LISTEN      26211/sshd

若集群已部署,除上述的检查外,还需要执行以下命令确认环境中是否有业务容器占用该端口(如果还有其他形式的端口占用,请根据实际情况检查)。具体如下:

¡     12345端口号未被占用,可以修改为该端口号。

[root@node1 ~]# kubectl get svc -A -oyaml | grep nodePort | grep -w 12345

[root@node1 ~]# kubectl get pod -A -oyaml | grep hostPort | grep -w 12345

¡     1234端口号被nodePort或hostPort占用,不可以修改为该端口号。

[root@node1 ~]# kubectl get svc -A -oyaml | grep nodePort | grep -w 1234

        nodePort: 1234

[root@worker ~]# kubectl get pod -A -oyaml | grep hostPort | grep -w 1234 

        hostPort: 1234

(2)     使用vim /etc/ssh/sshd_config命令进入sshd服务的配置文件,将配置文件中端口号修改为用户想要指定的端口号(以12345为例),且需要删除注释符号。

图6-1 修改前的端口号为22

 

图6-2 修改后的端口号

 

(3)     修改完成后,需重启sshd服务。

[root@node1 ~]# systemctl restart sshd

(4)     查看新的端口号是否修改成功。以Master节点为例,若有如下返回信息,则表示修改成功。

[root@node1 ~]# netstat -anp | grep -w 12345

tcp        0      0 0.0.0.0:12345            0.0.0.0:*               LISTEN      26212/sshd

tcp6       0      0 :::12345                 :::*                    LISTEN      26212/sshd

2. 修改Matrix侧各节点使用的SSH服务端口号

(1)     使用vim /opt/matrix/config/navigator_config.json命令进入navigator_config文件,查看该文件中是否存在sshPort字段,若存在,将该字段取值修改为用户想要指定的端口号(以12345为例);若不存在,则需手动添加该字段并为其赋值。下面以x86版本为例进行说明。

{

"productName": "uc",

"pageList": ["SYS_CONFIG", "DEPLOY", "APP_DEPLOY"],

…略…

"matrixLeaderLeaseDuration": 30,

"matrixLeaderRetryPeriod": 2,

"sshPort": 12345

}

(2)     修改完成后,需重启Matrix服务。

[root@node1 ~]# systemctl restart matrix

(3)     查看新的端口号是否修改成功。以Master节点为例,若成功,则日志中最后一条信息如下。

[root@node1 ~]# cat /var/log/matrix-diag/Matrix/Matrix/matrix.log | grep "ssh port"

2022-03-24T03:46:22,695 | INFO  | FelixStartLevel  | CommonUtil.start:232 | ssh port = 12345.

6.4.2  密钥登录

集群主用Master节点通过SSH连接管理和监控集群中的所有节点,当通过命令行修改某一节点密码后,还需登录Matrix页面修改对应节点的密码,若其它场景也保存了节点密码,则需同步修改(如跳板机、部署在Matrix上的应用),否则将会导致集群异常。整个过程易遗漏、易出错,且需较高的时间和人力成本。

各节点上配置SSH密钥登录后,无需在多处修改节点密码,集群节点间也可进行互相操作。

当前支持root用户和非root用户进行SSH密钥配置。

注意

·     请确保所有节点的SSH登录方式一致(如Matrix服务启动后,修改了某一节点的SSH登录方式,该操作需同步至所有节点。修改完成后请依次重启各节点Matrix服务)。

·     Matrix(包括集群和单机模式)部署完成后,若因重建/升级等原因重装节点操作系统时,在操作系统安装完成后、重建/升级操作前,请确保已完成所有节点的SSH密钥登录配置,且所有节点SSH登录方式必须一致(都为密钥登录),否则将会导致操作失败。

 

1. root用户配置SSH密钥配置

依次登录各节点后台进行SSH密钥配置。下面以node1节点为例,进行配置说明。

说明

执行ssh-keygen -R命令时如果出现文件或目录不存在的报错,属正常现象,可忽略。

 

(1)     root用户登录node1节点后台,执行如下命令,通过ED25519加密算法生成SSH对称认证所需的公钥和私钥文件。保存该公/私钥的文件名默认为/root/.ssh/id_ed25519,文件名不允许修改。

[root@node1 ~]# ssh-keygen -t ed25519

Generating public/private ed25519 key pair.

Enter file in which to save the key (/root/.ssh/id_ed25519):

Enter passphrase (empty for no passphrase):

Enter same passphrase again:

Your identification has been saved in /root/.ssh/id_ed25519

Your public key has been saved in /root/.ssh/id_ed25519.pub

The key fingerprint is:

SHA256:GLeq7ZQlnKHRTWvefTwIAlAHyeB3ZfZt0Ovnfbkcbak root@node1

The key's randomart image is:

…略…

(2)     首先清理各节点的旧公钥信息。然后将生成的公钥拷贝至各个节点(包括当前登录的节点)。下面以集群中有三个Master节点并且SSH端口号为默认的22为例进行配置说明。其中,node1 IP地址为192.168.227.171;node2 IP地址为192.168.227.172;node3 IP地址为192.168.227.173。

[root@node1 ~]# ssh-keygen -R 192.168.227.171

[root@node1 ~]# ssh-keygen -R 192.168.227.172

[root@node1 ~]# ssh-keygen -R 192.168.227.173

[root@node1 ~]# ssh-copy-id -p 22 -i  ~/.ssh/id_ed25519.pub [email protected]

[root@node1 ~]# ssh-copy-id -p 22 -i ~/.ssh/id_ed25519.pub [email protected]

[root@node1 ~]# ssh-copy-id -p 22 -i ~/.ssh/id_ed25519.pub [email protected]

(3)     登录其它节点后台,执行步骤(1)和(2)命令。

(4)     root用户登录node1节点后台,SSH到当前节点及其它节点,验证SSH密钥配置是否生效。下面以SSH到node2并且SSH端口号为默认的22为例进行配置说明。

[root@node1 ~]# ssh -p 22 [email protected]

2. 非root用户配置SSH密钥配置

依次登录各节点后台进行SSH密钥配置。

由于非root用户下部分命令需要以root权限执行,所以非root用户需配置admin到admin用户密钥配置、root到admin用户密钥配置。

说明

执行ssh-keygen -R命令时如果出现文件或目录不存在的报错,属正常现象,可忽略。

 

(1)     配置admin到admin用户密钥配置

下面以3个Master节点都为admin用户为例,进行配置说明。

a.     admin用户登录node1节点后台,执行ssh-keygen -t ed25519命令,生成SSH对称认证所需的公钥和私钥文件。保存该公/私钥的文件名默认为/home/admin/.ssh/id_ed25519,文件名不允许修改。

b.     首先清理各节点的旧公钥信息。然后将生成的公钥拷贝至各个节点(包括当前登录的节点)。下面以集群中有三个Master节点并且SSH端口号为默认的22为例进行配置说明。其中,node1 IP地址为192.168.227.171;node2 IP地址为192.168.227.172;node3 IP地址为192.168.227.173。

[root@node1 ~]# ssh-keygen -R 192.168.227.171

[root@node1 ~]# ssh-keygen -R 192.168.227.172

[root@node1 ~]# ssh-keygen -R 192.168.227.173

[root@node1 ~]$ ssh-copy-id -p 22 -i ~/.ssh/id_ed25519.pub [email protected]

[root@node1 ~]$ ssh-copy-id -p 22 -i ~/.ssh/id_ed25519.pub [email protected]

[root@node1 ~]$ ssh-copy-id -p 22 -i ~/.ssh/id_ed25519.pub [email protected]

c.     登录其它节点后台,执行步骤(a)和(b)命令。

d.     admin用户登录节点后台,SSH到当前节点及其它节点,验证SSH密钥配置是否生效。

[root@node1 ~]$ ssh -p 22 [email protected]

(2)     配置root到admin用户密钥配置

a.     admin用户登录node1节点后台,并将用户切换至root用户下。

b.     请依次执行以下操作:生成新的公钥和私钥文件,清理旧的公钥信息,并将新公钥拷贝到所有节点(包括当前登录的节点)。

c.     登录其它节点后台,执行步骤(a)和(b)命令。

d.     admin用户登录节点后台,并将用户切换至root用户下。SSH到当前节点及其它节点的admin用户,验证SSH密钥配置是否生效。

[root@node1 ~]# ssh -p 22 [email protected]

3. Matrix侧SSH密钥登录配置

(1)     使用vim /opt/matrix/config/navigator_config.json命令进入navigator_config文件,查看该文件中是否存在sshLoginMode字段,若存在,将该字段取值修改为secret;若不存在,则需手动添加该字段并为其赋值。下面以x86版本为例进行说明。

{

"productName": "uc",

"pageList": ["SYS_CONFIG", "DEPLOY", "APP_DEPLOY"],

…略

"matrixLeaderLeaseDuration": 30,

"matrixLeaderRetryPeriod": 2,

"sshPort": 22,

"sshLoginMode":"secret"

}

(2)     重启Matrix服务,使SSH登录方式修改生效。

[root@node1 ~]# systemctl restart matrix

(3)     查看修改的SSH登录方式是否生效。

[root@node1 ~]# cat /var/log/matrix-diag/Matrix/Matrix/matrix.log | grep "sshLoginMode"

2022-03-31T20:11:08,119 | INFO  | features-3-thread-1 | CommonUtil.start:245 | ssh port = 22, sshLoginMode = secret.

 


7 部署统一数字底盘

注意

·     对于使用内置NTP服务器的场景,在部署集群之前,需确保所有节点的系统时间和当前时间保持一致。对于使用外置NTP服务器作为时钟同步源的场景,需确保外置NTP服务器的时间与当前时间保持一致。如果NTP服务器网络不通、出现故障或时间不准确时,可能导致Matrix集群部署失败。

·     查看及修改节点系统时间的命令如下:date(查看系统时间);date -s yyyy-mm-dd(修改系统时间的年月日);date -s hh:mm:ss(修改系统时间的时分秒)。

·     在应用部署、升级过程中,不能执行重启Matrix服务、重启节点和断开节点服务器电源操作,否则会造成应用部署数据出现损坏(例如Etcd数据错误、磁盘文件损坏等),造成应用部署、升级失败。

 

7.1  部署前的检查

(1)     依次登录各节点后台,执行sudo bash /opt/matrix/tools/env_check.sh命令进行环境检查,并根据检查结果进行相应处理。

说明

·     统一数字底盘支持的所有操作系统都可执行env_check.sh脚本。

·     在CPU频率低于2000MHz的情况下,Matrix的自检脚本(env_check.sh)和健康检查模块会打印CPU频率告警。请检查服务器硬件是否满足要求,并确保CPU供电模式设置为高性能(performance)模式(例如NingOS系统可执行cpupower frequency-set -g performance命令)。

·     可在节点后台执行sudo bash /opt/matrix/tools/env_check.sh -h命令查看帮助,获取更多脚本使用方式。例如:查询Etcd磁盘IOPS性能的命令为sudo bash /opt/matrix/tools/env_check.sh -p -d /var/lib/etcd

 

下表中所示的各项未在env_check.sh脚本中进行检查,请手动确认,确保安装Matrix的条件已经具备。

表7-1 安装环境确认

检测项

检测标准

网口

Matrix单独使用一个网口,不允许在此网口上配置子接口及子IP。

IP地址

·     Matrix节点其它网口上的IP地址不允许和本节点Matrix使用的IP地址相同网段。

·     节点与Matrix集群其它节点通信使用的IP源地址,必须为建立Matrix集群使用的IP地址。可以使用命令ip route get targetIP获取主机访问目标IP时使用的源地址,其中targetIP为目标IP。

[root@node1 ~]# ip route get 100.100.5.10

100.100.5.10 via 192.168.10.10 dev eth0 src 192.168.5.10

时区

·     请确保Matrix所有节点的系统时区必须相同(可使用命令timedatectl查看各节点的系统时区),否则将会导致在GUI页面上增加节点失败。

·     选择时区时,不允许选择“北京”。

主机名

请确保主机名符合如下标准,否则集群将会建立失败。

·     各节点的主机名不能相同。

·     请勿使用默认主机名(localhost、localhost.localdomain、localhost4、localhost4.localdomain4、localhost6、localhost6.localdomain6)。

·     主机名称最长63个字符,仅支持小写字母、数字、连字符和小数点,不能以0开头且全为数字,不能以0x、连字符、小数点开头,不能以连字符、小数点结尾。

 

(2)     在部署统一数字底盘UDTP_Base_version_platform.zip组件前,请在各节点执行cat /proc/sys/vm/nr_hugepages命令检查大页是否开启,如果返回结果不是0,请记录该值,并执行echo 0 > /proc/sys/vm/nr_hugepages命令临时关闭大页。待部署UDTP_Base_version_platform.zip组件完成后,再将echo 0 > /proc/sys/vm/nr_hugepages命令中的数字0改为记录的值,并在各节点执行,以恢复大页配置。

7.2  创建Matrix集群

7.2.1  登录Matrix

说明

·     可在Matrix上进行如下操作:上传、删除统一数字底盘应用安装包;部署、升级、扩容、卸载统一数字底盘应用;升级、重建集群节点;增加、删除Worker节点。

·     部署集群节点时,要求主机名称不得重复,当集群部署成功后,不允许修改集群节点的主机名。

·     集群部署过程中不支持登录集群各节点进行任何操作,也不支持在其他集群中添加当前集群部署中的节点。

 

(1)     在浏览器中输入Matrix的登录地址,进入如下图所示登录页面。

a.     若使用IPv4地址,登录地址格式为:https://ip_address:8443/matrix/ui,例如:https://172.16.101.200:8443/matrix/ui。本文档后续配置均以IPv4配置为例。

b.     若使用IPv6地址,登录地址格式为:https://[ip_address]:8443/matrix/ui,例如:https://[2000::100:611]:8443/matrix/ui。

登录地址中参数含义如下:

ip_address为节点IP地址。

8443为缺省端口号。

说明

采用集群部署模式时,未部署集群之前,ip_address可以是任意一个规划为Master节点的IP地址。

 

图7-1 Matrix登录页面

 

(2)     输入用户名和密码(默认用户名为admin,密码为Pwd@12345,若安装操作系统设置过密码,则按设置的填写)后,单击<登录>按钮,默认进入Matrix的集群部署页面,部署双栈集群需要开启双栈按钮。

图7-2 集群单栈部署页面

 

图7-3 集群双栈部署页面

 

7.2.2  配置集群参数

部署集群节点前,需要先配置集群参数。配置集群参数,各参数的介绍如下两表所示。

表7-2 单栈集群参数说明

参数

说明

北向业务虚IP

集群对外提供服务的IP地址,该地址必须在Master节点所处的网段内。

Service IP地址池

用于为Service分配IP地址,不能与部署环境中的其它网段冲突。默认地址为10.96.0.0/16,一般保持默认值。

容器IP地址池

用于为容器分配IP地址,不能与部署环境中的其它网段冲突。默认地址为177.177.0.0/16,一般保持默认值。

虚IP模式

取值为内置虚IP、外置虚IP。内置模式下虚IP由Matrix下发到集群内,并由Matrix管理虚IP在集群节点间的漂移;外置模式下,虚IP由第三方平台或软件下发到集群外,不再由Matrix管理。默认为内置模式。

说明:E0713版本开始,新增该字段。

集群网络模式

·     单子网:集群内所有节点、虚IP必须在相同网段内,否则将无法互相通信。

·     单子网-VXLAN:集群内所有节点、虚IP必须在相同网段内,否则将无法互相通信。单子网-VXLAN模式仅支持IPv4网络。

¡     如果在集群上联交换机上配置安全策略如ACL,不允许以Service IP地址池和容器IP地址池中的地址为源的报文转发,需要使用单子网VXLAN。

¡     在公有云和私有云场景下,因为云上的网络限制,需要使用单子网VXLAN网络。

NTP服务器

·     用于保证集群内各节点系统时间的一致性,支持选择内置服务器和外置服务器。选择外置服务器时,需要配置NTP服务器地址,且该地址不可与集群内各节点的IP地址冲突。

·     本文档使用内置服务器作为NTP服务器,则部署集群时会首先进行时间同步,集群部署完成后,三台Master节点会定时同步时间,从而保证集群内各节点的系统时间保持一致。

·     如需部署上下级环境,必须为上级和下级配置相同的NTP服务器,以确保上下级的时间一致。

外置DNS服务器

用于解析K8s集群外部的域名,格式为IP:Port,部署统一数字底盘可根据实际需要配置外置DNS服务器。本文档中不配置此项。

·     容器解析域名时,集群外部的域名无法被内置DNS服务器解析,本平台将把需要解析的外部域名随机转发给一台外置DNS服务器来解析。

·     外置DNS服务器最多可以配置10个,各外置DNS服务器要求具有相同的DNS解析能力,并可以独立满足外部域名解析需求、无主备之分、无先后顺序之分。

·     建议所有的DNS服务器都能够访问根域,可使用命令行nslookup -port={port} -q=ns . {ip}查看是否可以访问。

自定义虚IP

通常用于隔离集群网络与管理网络。不能与部署环境中的其它网段冲突。

 

表7-3 双栈集群参数说明

参数

说明

北向业务虚IP(IPv4、IPv6)

集群对外提供服务的IP地址,该地址必须在Master节点所处的网段内,分别分配IPv4地址,IPv6地址。北向业务虚IP至少配置一个IPv4或IPv6,不可同时配置两个相同协议的IP。配置IPv6地址时,请勿以冒号结尾。

Service IP地址池

双栈环境下生效。

用于为Service分配IPv4、IPv6地址,默认IPv4地址为10.96.0.0/16,默认IPv6地址为fd00:10:96::/112,,一般保持默认值。集群部署后不允许更改。

该地址池不能与部署环境中其它网段冲突,否则可能会导致集群异常。

容器IP地址池

双栈环境下生效。

用于为容器分配IPv4、IPv6地址,默认IPv4地址为177.177.0.0/16,默认IPv6地址为fd00:177:177::/112,一般保持默认值。集群部署后不允许更改。

该地址池不能与部署环境中其它网段冲突,否则可能会导致集群异常。

虚IP模式

取值为内置虚IP、外置虚IP。内置模式下虚IP由Matrix下发到集群内,并由Matrix管理虚IP在集群节点间的漂移;外置模式下,虚IP由第三方平台或软件下发到集群外,不再由Matrix管理。默认为内置模式。

说明:E0713版本开始,新增该字段。

集群网络模式

双栈模式下仅支持单子网模式。

·     单子网:集群内所有节点、虚IP必须在相同网段内,否则将无法互相通信。

NTP服务器

·     用于保证集群内各节点系统时间的一致性,支持选择内置服务器和外置服务器。选择外置服务器时,需要配置NTP服务器地址,且该地址不可与集群内各节点的IP地址冲突。

·     本文档使用内置服务器作为NTP服务器,部署集群时会首先进行时间同步,集群部署完成后,三台Master节点会定时同步时间,从而保证集群内各节点的系统时间保持一致。

·     如需部署上下级环境,必须为上级和下级配置相同的NTP服务器,以确保上下级的时间一致。

外置DNS服务器

用于解析K8s集群外部的域名,格式为IP:Port,部署统一数字底盘可根据实际需要配置外置DNS服务器。本文档中不配置此项。

·     容器解析域名时,集群外部的域名无法被内置DNS服务器解析,本平台将把需要解析的外部域名随机转发给一台外置DNS服务器来解析。

·     外置DNS服务器最多可以配置10个,各外置DNS服务器要求具有相同的DNS解析能力,并可以独立满足外部域名解析需求、无主备之分、无先后顺序之分。

·     建议所有的DNS服务器都能够访问根域,可使用命令行nslookup -port={port} -q=ns . {ip}查看是否可以访问。

自定义虚IP

通常用于隔离集群网络与管理网络。不能与部署环境中的其它网段冲突。

 

说明

若NTP服务器不与北向地址相通,可以先不增加NTP服务器。待集群创建完成后,在配置网卡网络时,通过修改集群参数再增加。

 

7.2.3  创建集群

单机部署模式下,仅需增加一个Master节点即可部署集群。集群部署模式下,需要增加三个Master节点后,再部署集群。

(1)     配置集群参数后,单击<下一步>按钮,进入创建集群页面,如下图所示。

图7-4 集群部署页面

 

(2)     单击Master节点区域的增加图标,弹出增加节点窗口,如下图所示。

图7-5 增加单栈节点窗口

 

图7-6 增加双栈节点窗口

 

(3)     配置如下参数:

¡     类型:显示为“Master”,且不可修改。

¡     IP地址:规划的Master节点的IP地址。支持批量添加Master节点,批量添加模式下,各Master节点的用户名和密码需相同。

¡     用户名:节点操作系统的用户名。根据安装操作系统时实际选择的用户填写。集群中所有节点的用户名必须相同。

¡     密码:节点操作系统的用户密码。

(4)     单击<确定>按钮,完成增加Master节点操作。

(5)     单击<开始部署>按钮,开始部署集群,当所有节点的进度达到100%时,表示集群部署成功。

集群部署成功后,主Master节点会在节点左上角显示标记,其余未被标记的Master节点为备用Master节点。

(6)     集群部署完成后,配置网络和部署应用的操作可以先跳过,后期根据实际需要再进行配置。

图7-7 集群部署完成

 

说明

Matrix部署完成后,如需执行kubectl命令,请断开重连当前SSH会话后再执行对应命令,否则kubectl命令无法执行,提示The connection to the server localhost:8080 was refused - did you specify the right host or port?

 

7.3  部署统一数字底盘Base应用包

注意

上传安装包时,需保证浏览器到集群之间的网络连接稳定,且连接带宽不能低于10Mbps,否则会导致安装包上传耗时长或上传失败。

 

应用包仅支持在Matrix页面进行部署,支持批量上传应用包,但必须先部署Base,再部署其他应用。

(1)     在浏览器中输入“https://ip_address:8443/matrix/ui”,登录Matrix。其中“ip_address”为北向业务虚IP地址。

(2)     单击[部署>应用]菜单项,进入应用列表页面。

(3)     在单机部署模式下,用户可以选择标准部署模式或代理部署模式。组件安装完成后将无法更改部署模式。本章节以选择标准部署模式为例进行介绍。

¡     标准部署模式:适用于标准架构的系统,以及Server-Proxy架构的Server端。支持部署统一数字底盘所有组件。

¡     代理部署模式:用于Server-Proxy架构中的Proxy端,适用于U-Center产品。仅支持部署统一数字底盘的Base、Connect、UCP_BasePlat和UCP_CollectPlat组件。

说明

·     如果需要将统一数字底盘从E7103版本升级到E7104或更高版本的精简proxy模式,请参考《精简proxy升级工具使用指导》获取具体方法。

·     如需修改部署模式(例如标准模式修改为代理模式),请重装Matrix。仅通过重装Base组件进行修改可能会导致其他组件部署异常。

 

图7-8 选择部署模式

 

(4)     单击<部署应用>按钮,进入安装Base界面。

图7-9 安装Base页面

 

(5)     单击<上传>按钮,在弹框中上传Base安装包。

图7-10 上传Base安装包

 

(6)     Base上传完成后,在当前页面勾选Base应用安装包,并单击页面底部的<下一步>按钮。

说明

请不要勾选其他应用包,否则无法安装Base。

 

图7-11 Base上传完成

 

(7)     在当前页面无需任何操作,直接单击页面底部的<下一步>按钮。

图7-12 应用选择

 

(8)     单击<修改>按钮,配置Base参数,配置完成后单击<确定>按钮保存配置。

说明

当使用PolarDB数据库时,需要额外配置相关的数据库参数,具体请参考《第三方数据库PolarDB v2.0安装部署指导》。

 

表7-4 Base参数配置说明

配置项

配置项参数说明

资源档位

单机模式支持选择single_large、single_medium、single_small三种档位。

集群模式支持选择cluster_large、cluster_medium、cluster_small三种档位

部署协议

可选择http和https。

HTTP协议端口号

缺省值30000。

HTTPS协议端口号

缺省值30443。

CPU厂商信息

根据实际情况选择对应的CPU厂商。

是否使用第三方数据库

可选择true、false。

主题

可选择white、star。

语言

可选择zh_CN、en_US。

 

图7-13 参数配置页面

 

(9)     参数配置完成后,单击<部署>按钮,开始部署Base。

(10)     Base部署完成后,原[部署>应用]页面自动更新为[部署>融合部署]页面,可在该页面下部署其他可选包。


8 部署全景运维地图组件

支持在Matrix融合部署页面部署全景运维地图组件。

说明

·     在安装前,请确认Super Controller的部署情况。如果已部署包含全景运维地图功能的Super Controller,请先将其升级到不包含该功能的版本。

·     若部署过程中遇服务器断电、重启等特殊情况,服务不可用,需要人工确认具体原因后再进行后续操作。

 

8.1  登录Matrix

(1)     在浏览器中输入“https://ip_address:8443/matrix/ui”,登录Matrix。其中“ip_address”为北向业务虚IP地址。8443为端口号。

(2)     进入[部署>融合部署]页面。

图8-1 融合部署页面

 

8.2  上传安装包

(1)     单击<安装包管理>按钮,进入安装包管理页面。

图8-2 安装包管理

 

(2)     单击<上传>按钮,在弹出的对话框中单击<选择文件>按钮,选择全景运维地图组件安装包及其依赖的组件,再单击<上传>按钮上传到系统。

图8-3 上传安装包

 

8.3  应用选择

(1)     在部署管理页面,单击<安装>按钮,进入安装导航页面。

(2)     在“应用选择”步骤,在“场景选择”区域按需选择DC场景。在“Data Center”区域勾选“SeerEngine-Digitalmap”选框,并勾选其他依赖的应用。

图8-4 场景选择

 

图8-5 安装包选择

 

(3)     单击<下一步>按钮进入安装包选择页面。

8.4  安装包选择

在“数据中心场景”区域选择组件的安装包,单击<下一步>按钮进入资源配置页面。

图8-6 选择安装包

8.5  资源配置

在“资源配置”步骤,根据硬件配置选择对应的资源档位。同一业务集中的应用分批部署时,请使用相同资源档位部署。单击<下一步>按钮。

图8-7 资源配置

 

8.6  参数配置

全景运维地图组件无需进行参数配置,单击<部署>按钮,页面展示将部署的应用,确认无误后,单击<确认>按钮开始部署。页面上将展示部署进度。

 

 


9 登录全景运维地图组件

全景运维地图组件部署完成后将在统一数字底盘中加载对应菜单项,登录统一数字底盘即可使用全景运维地图功能。

统一数字底盘提供友好的GUI界面。具体登录方式如下:

(1)     在浏览器中输入统一数字底盘登录地址(默认登录地址:http://ip_address:30000),回车后会进入如下图所示登录界面。

¡     ip_address:为统一数字底盘所在的集群北向业务虚IP地址。

¡     30000为端口号。

图9-1 统一数字底盘登录页面

(2)     输入用户名密码登录统一数字底盘,缺省用户名为admin,密码为Pwd@12345。登录成功后进入主页面。

 


10 软件注册

全景运维地图组件安装完成后,可180天内试用所有功能,超过试用期限后,需要获取License授权才能正常使用。

 

10.1  在License Server上安装授权

关于授权的申请和安装过程,请参见《H3C软件产品远程授权License使用指南》。

10.2  获取License授权

在License Server上安装产品的授权后,只需在产品的License管理页面与License Server建立连接即可获取授权,操作步骤如下:

(1)     登录统一数字底盘,单击[系统>License管理>License信息]菜单项,进入License信息管理页面。

(2)     在页面中配置License Server信息的参数。各参数介绍请参见下表。

表10-1 配置参数说明

参数

说明

IP地址

安装License Server的服务器上用于组件集群内各节点之间通信的IP地址

端口号

此处缺省值为“5555”,与License Server授权服务端口号保持一致

客户端名称

License Server中设置的客户端名称

客户端密码

License Server中设置的客户端名称对应的密码

 

(3)     配置完成后,单击<连接>按钮与License Server建立连接,连接成功后全景运维地图组件可自动获取授权信息。

 


11 备份恢复

在统一数字底盘中可对全景运维地图组件执行备份恢复操作,具体步骤请参见《H3C 统一数字底盘部署指导》。

 


12 软件升级及卸载

本章节介绍全景运维地图组件的升级及卸载步骤。

12.1  升级全景运维地图组件

说明

若升级过程中遇服务器断电、重启等特殊情况,服务不可用,需要人工确认具体原因后再进行后续操作。

 

在Matrix融合部署页面上支持对组件进行保留配置升级。升级组件可能会导致业务中断,请谨慎操作。

升级步骤如下:

(1)     登录Matrix,单击[部署>融合部署]菜单项,进入部署管理页面。

(2)     单击Data Center左侧的按钮,展开信息。

(3)     单击SeerEngine-Digitalmap对应操作列的升级图标,进入升级页面。

图12-1 融合部署页面

 

(4)     单击<上传>按钮,在弹出的对话框中单击<选择文件>按钮,选择待升级的安装包。选择完成后单击<上传>按钮。

(5)     勾选待升级的安装包后,单击<升级>按钮,完成组件升级。

图12-2 选择安装包

 

(6)     若组件升级失败,单击<回滚>按钮,可将组件回退到升级之前的版本。

说明

升级完成后,请手动清除浏览器缓存后重新登录。

 

12.2  卸载全景运维地图组件

卸载全景运维地图组件的具体操作如下:

(1)     登录Matrix,进入[部署>融合部署]页面。

(2)     勾选待卸载组件左侧的复选框,单击<卸载>按钮,卸载指定的组件。

图12-3 卸载组件

 


13 常见问题解答

13.1  Matrix常见问题解答

13.1.1  如何配置Matrix集群主老化时间?

注意

集群各节点/opt/matrix/config/navigator_config.json中的配置必须保持一致,否则会影响集群稳定性。

 

(1)     登录集群中所有Master节点后台。

(2)     在navigator_config.json配置文件中,修改matrixLeaderLeaseDuration和matrixLeaderRetryPeriod参数取值。请确保集群中所有Master节点的参数配置相同。若配置文件中无上述两个参数,请手动增加。

下面以matrixLeaderRetryPeriod为2,matrixLeaderLeaseDuration为30为例进行修改。

[root@matrix01 ~]# vim /opt/matrix/config/navigator_config.json

{

"matrixLeaderLeaseDuration": 30,

"matrixLeaderRetryPeriod": 2,

}

(3)     修改完之后,重启集群服务。

[root@matrix01 ~]# systemctl restart matrix

说明

·     matrixLeaderLeaseDuration:用于配置集群主老化时间,取值为正整数,且大于等于matrixLeaderRetryPeriod * 10。

·     matrixLeaderRetryPeriod:用于配置集群刷新主节点时锁的间隔时间,取值为正整数。

 

13.1.2  扩容Matrix时若在ETCDINSTALL阶段停留时间过长怎么办?

若扩容Matrix过程中长时间没有成功,可通过集群部署页面单击扩容节点的日志查看,是否是因为在ETCDINSTALL阶段停留时间过长(ETCDINSTALL-PENDING距离当前系统时间十五分钟以上视为停留过长),登录原单机环境后台执行etcdctl member list命令返回失败,则可通过如下方式将环境恢复至扩容前的状态,然后再次进行扩容:

(1)     登录原单机环境后台。

(2)     执行cp -f /opt/matrix/k8s/deployenv.sh.bk /opt/matrix/k8s/deployenv.sh命令还原deployenv.sh脚本。

(3)     root用户通过systemctl stop matrix停止节点上Matrix服务。使用命令systemctl status matrix验证Matrix服务是否已经停止。若停止成功,则将在Active字段后显示运行信息为inactive (dead)。

[root@master1 ~]# systemctl stop matrix

非root用户通过sudo /bin/bash -c "systemctl stop matrix"停止节点上Matrix服务

[admin@node4 ~]$ sudo /bin/bash -c "systemctl stop matrix"

(4)     通过mv /etc/kubernetes/manifests/kube-apiserver.yaml /opt/matrix停止kube-apiserver。使用命令docker ps | grep kube-apiserver验证kube-apiserver服务是否已经停止。若无回显表示服务已停止。

[root@master1 ~]# mv /etc/kubernetes/manifests/kube-apiserver.yaml /opt/matrix

[root@master1 ~]# docker ps | grep kube-apiserver //查询是否已停止kube-apiserver

[root@master1 ~]#  //无回显表示服务已停止

(5)     root用户通过systemctl stop etcd完全停止etcd服务,使用命令systemctl status etcd验证etcd服务是否已经停止。若停止成功,则将在Active字段后显示运行信息为inactive (dead)。通过命令rm -rf /var/lib/etcd/default.etcd/删除etcd数据目录,确保/var/lib/etcd下面没有数据目录。

[root@master1 ~]# systemctl stop etcd

[root@master1 ~]# rm -rf /var/lib/etcd/default.etcd/

[root@master1 ~]# ll /var/lib/etcd/

非root用户通过sudo /bin/bash -c "systemctl stop etcd"完全停止etcd服务,并且通过命令sudo /bin/bash -c "rm -rf /var/lib/etcd/default.etcd/"删除etcd数据目录,确保/var/lib/etcd下面没有数据目录

[admin@node4 ~]$ sudo /bin/bash -c "systemctl stop etcd"

[admin@node4 ~]$ sudo /bin/bash -c "rm -rf /var/lib/etcd/default.etcd/"

[admin@node4 ~]$ ll /var/lib/etcd/

(6)     进入ETCD恢复脚本目录。

[root@master1 ~]# cd /opt/matrix/k8s/disaster-recovery/

(7)     执行etcd恢复脚本前,在etcd备份目录/opt/matrix/backup/etcd_backup_snapshot/找到最新的备份数据文件Etcd_Snapshot_Before_Scale.db。

root用户执行恢复操作命令如下

[root@master1 ~]# bash etcd_restore.sh Etcd_Snapshot_Before_Scale.db

非root用户执行恢复操作命令如下

[admin@node4 ~]$ sudo bash etcd_restore.sh Etcd_Snapshot_Before_Scale.db

(8)     root用户通过systemctl restart etcd重启etcd服务

[root@master1 ~]# systemctl restart etcd

非root用户通过sudo /bin/bash -c "systemctl restart etcd"重启etcd服务

[admin@node4 ~]$ sudo /bin/bash -c "systemctl restart etcd"

(9)     root用户通过systemctl restart matrix重启matrix服务

[root@master1 ~]# systemctl restart matrix

非root用户通过sudo /bin/bash -c "systemctl restart matrix"重启matrix服务

[admin@node4 ~]$ sudo /bin/bash -c "systemctl restart matrix"

(10)     恢复kube-apiserver

[root@master1 ~]# mv /opt/matrix/kube-apiserver.yaml /etc/kubernetes/manifests/

(11)     故障恢复完成后,登录Matrix集群部署页面,单击<开始部署>按钮再次扩容。

13.1.3  Matrix安装完成后,页面无法访问怎么办?

(1)     执行rm -rf /opt/matrix/data/ && systemctl restart matrix.service命令尝试恢复。

(2)     若该操作无法恢复,请手动上传Matrix安装包并解压,然后先后执行uninstall.sh和install.sh脚本卸载重装Matrix服务。

(3)     若依然无法恢复,请联系技术支持。

13.1.4  在Matrix中添加节点失败怎么办?

当在Matrix中添加节点失败,并且在/var/log/matrix-diag/Matrix/Matrix/matrix.log日志中报错“java.lang.NoClassDefFoundError”时,可执行以下操作解决:

(1)     执行rm -rf /opt/matrix/data/ && systemctl restart matrix.service命令尝试恢复。

(2)     若该操作无法恢复,请手动上传Matrix安装包并解压,然后先后执行uninstall.sh和install.sh脚本卸载重装Matrix服务。

(3)     若依然无法恢复,请联系技术支持。

13.1.5  Matrix部署失败时应该执行什么操作?

当Matrix部署失败时,查看日志“phase IMAGE_INSTALL end. cname=ImageInstallPhase, phaseResult=false”则表示是在K8S阶段部署失败,可执行如下操作解决:

(1)     执行rm -rf /opt/matrix/data/ && systemctl restart matrix.service命令尝试恢复。

(2)     若该操作无法恢复,请手动上传Matrix安装包并解压,然后先后执行uninstall.sh和install.sh脚本卸载重装Matrix服务。

(3)     若依然无法恢复,请联系技术支持。

13.1.6  Matrix如何切换双栈?

(1)     登录Matrix页面,进入[部署>集群>集群参数]页面。

(2)     单击<修改>按钮,将“开启双栈”置于启用状态后单击<确定>按钮。

(3)     IPv4切换双栈:分别输入节点的IPv6地址和北向业务虚IP的IPv6地址。其中,节点的IPv6地址需要提前配置,可参考《H3C 统一数字底盘操作系统安装指导》的“网络和主机名”配置步骤,若操作系统已安装完成,可参考《H3C 统一数字底盘操作系统安装指导》的“操作系统安装完成后,在原网卡上配置IPv6地址”配置步骤进行配置。

(4)     IPv6切换双栈:分别输入节点的IPv4地址和北向业务虚IP的IPv4地址。其中,节点的IPv4地址需要提前配置,可参考《H3C 统一数字底盘操作系统安装指导》的“网络和主机名”配置步骤,若操作系统已安装完成,可参考《H3C 统一数字底盘操作系统安装指导》的“操作系统安装完成后,在原网卡上配置IPv6地址”配置步骤进行配置。

13.1.7  如何在Matrix页面开启统一数字底盘组件应用服务?

(1)     登录Matrix页面,进入[观测>监控>应用监控]页面。

(2)     展开组件可以查看组件下的应用服务状态。

(3)     单击“操作列”的/可以启用/关闭应用服务。

图13-1 查看应用服务

 

13.2  浏览器常见问题解答

注意

集群各节点/opt/matrix/config/navigator_config.json中的配置必须保持一致,否则会影响集群稳定性。

 

13.2.1  如何通过映射IP访问Matrix页面?

Matrix支持外部浏览器通过映射后的节点IP和虚IP访问Web页面,支持NAT映射和域名映射,不支持端口映射,必须使用8443端口。

如需使用映射IP访问Matrix页面,需在集群内各节点上进行以下操作:

(1)     将映射后的IP(或域名)加入到/opt/matrix/config/navigator_config.json的“httpHeaderHost”属性值中(若无该属性请手动补充,多个IP或域名使用英文逗号分隔),示例:"httpHeaderHost":"10.10.10.2,10.10.10.3"。

(2)     配置完后可以通过cat /opt/matrix/config/navigator_config.json | jq命令检查配置格式是否正确。

(3)     修改后需要通过service matrix restart重启服务生效,集群各节点配置需要保持一致。

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们