手册下载
01-AD-WAN分支6.6 统一数字底盘及组件部署指导-整本手册.pdf (5.59 MB)
AD-WAN分支6.6
统一数字底盘及组件部署指导
资料版本:5W103-20240930
Copyright © 2024 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
SeerEngine-SDWAN是构建广域网的控制组件,可实现WAN分支场景的业务自动化和智能流量调度。
SeerEngine-SDWAN基于统一数字底盘运行,需要先安装统一数字底盘,作为统一数字底盘的组件进行部署。统一数字底盘的安装和部署基于Matrix,该平台基于Kubernetes,实现了对Docker容器的编排调度。Matrix主要用于Kubernetes集群的搭建,微服务的部署,以及系统、Docker容器、微服务等的运维监控。
本文仅介绍AD-WAN分支解决方案相关组件的部署流程以及对服务器资源和磁盘分区的要求。如果涉及服务器资源和硬件配置要求,可以参考《AD-NET解决方案硬件配置指导》。
如果涉及统一数字底盘及Matrix的升级或者卸载以及各组件的部署,可以参考《H3C 统一数字底盘部署指导》、《H3C SeerEngine-SDWAN组件部署指导》、《H3C SeerAnalyzer 安装部署指导》。参考的产品版本文档应当与方案配套表产品版本匹配。
统一数字底盘各组件支持使用共享存储作为存储。各业务场景是否支持共享存储,请参考《AD-NET解决方案硬件配置指导》和相应业务场景的部署指导中的硬件配置要求。为提高性能和稳定性,建
议系统数据分区使用本地存储,业务数据分区使用共享存储。
· 在中大规模(设备规模大于200台)场景推荐物理机部署。
· 在使用VMware管理的虚拟机上部署SeerEngine-SDWAN控制组件时,需要在虚拟机所在的主机上开启网卡混杂模式和伪传输功能。
· 分配给统一数字底盘的CPU、内存和磁盘必须符合推荐容量要求且确保有对应容量的物理资源,禁止启用超配模式(超额分配虚拟机资源),否则会导致统一数字底盘环境不稳定。
· 推荐安装etcd 的磁盘与安装系统及其它组件的磁盘分别对应不同的物理硬盘,若无法满足,则最低配置为7200转HDD盘+1G RAID卡,推荐使用SSD盘。
· 部署操作系统前需要通过服务器硬件RAID卡制作RAID,统一数字底盘不支持服务器通过软件制作RAID。
· 为保证磁盘性能达到要求,请确保已开启RAID卡缓存。
统一数字底盘x86版本,支持多种操作系统并且基于Matrix 安装。
· 在H3Linux的镜像文件中集成了操作系统、Matrix 等应用软件包。在完成H3Linux操作系统安装后,将自动安装需要的依赖包及Matrix。因此用户无需手动安装依赖包及Matrix。
· 非H3Linux 操作系统,需要先部署操作系统及依赖包,再部署Matrix。
具体统一数字底盘支持的操作系统及版本,请参见《H3C统一数字底盘部署指导》。
用户不需要安装客户端软件,使用浏览器即可访问统一数字底盘。推荐使用的浏览器为Google Chrome 70及以上版本,Firefox 78及以上版本,不建议使用其它浏览器。
表3-1 客户端配置要求
操作系统 |
硬件要求 |
浏览器配置要求 |
Windows(简 体中文版) |
主频2.0G Hz(以上)、内存2GB(以 上)、硬盘50GB(以上)、100M网 卡(以上)、声卡 |
· 关闭浏览器的弹出窗口阻塞设置 · 必须使能浏览器的Cookies · iMC站点加入受信任站点 · 客户端分辨率显示宽度至少为1600x900 · 推荐使用Firefox 78及以上版本 · 推荐使用Chrome 70及以上版本 |
AD-WAN分支方案安装中组网规划包括两个方面:
· 硬盘RAID和分区规划
· IP地址规划
在开始部署前,请先完成对应的组网规划。
图4-1 组网图
· 图中绿色实线代表统一数字底盘服务器使用的物理链路,SeerEngine-SDWAN控制组件不需要单独的网络接入。
· SeerAnalyzer+SDWAN融合场景推荐使用南北向网络合一(南向无网络),即分析组件不配置单独的南向网络。
· SeerAnalyzer+SDWAN融合场景无需部署SeerCollector采集组件节点,无需规划SeerCollector采集组件IP地址。
根据不同的业务量和不同的服务器配置需求进行不同的磁盘RAID和分区规划。
· 一般情况下,磁盘分区的文件系统类型默认选择xfs,部分分区有特殊要求,请根据备注进行配置。
· 磁盘空间充足时,/var/lib/docker、/var/lib/ssdata、/,三个挂载点可以平均扩容。
配置磁盘RAID后硬盘容量大小请参考《AD-NET解决方案硬件配置指导》,硬盘分区规划参见表4-1。如需部署仲裁服务节点,磁盘分区规划请参考表4-2,如需部署SeerAnalyzer组件,需要增加数据盘分区,请根据实际网络规模和业务数据量选择参考表4-3或表4-4。
表4-1 磁盘RAID和分区规划
磁盘RAID规划 |
挂载点 |
最低容量 |
适用模式 |
备注 |
2*1.92TB,RAID1 |
/var/lib/docker |
350 GiB |
BIOS模式/UEFI模式 |
磁盘空间充足时,可适当扩容 |
/boot |
1 GiB |
BIOS模式/UEFI模式 |
- |
|
swap |
1 GiB |
BIOS模式/UEFI模式 |
SeerAnalyzer+SDWAN融合场景,建议至少配置4GiB |
|
/var/lib/ssdata |
700GiB |
BIOS模式/UEFI模式 |
磁盘空间充足时,可适当扩容 |
|
/ |
350 GiB |
BIOS模式/UEFI模式 |
磁盘空间充足时,可适当扩容 |
|
/boot/efi |
0.2 GiB |
UEFI模式 |
- |
|
预留磁盘空间 |
450 GiB |
- |
GlusterFS使用,需要后台进行手动分区。 |
|
2*50GB,RAID1 |
/var/lib/etcd |
50 GiB |
BIOS模式/UEFI模式 |
不强制挂载一个单独的磁盘 |
节点名称 |
节点配置数量 |
单节点详细配置 |
仲裁服务节点 |
1 |
· CPU:32核主频,2*(2*Hygon G5 5380 16核,2.5GHz) · 内存:16GB及以上 · 磁盘:需要配置RAID,RAID模式可选RAID1、RAID10。以下配置任选其一 · 磁盘配置1: ¡ 系统盘:2*480GB SSD,RAID1(RAID配置后的磁盘总容量需大于等于256GB),IOPS至少5000次/s ¡ ETCD盘:2*480GB SSD,RAID1(RAID配置后的磁盘总容量需大于等于50GB),安装路径:/var/lib/etcd · 磁盘配置2: ¡ 系统盘:2*600GB HDD,RAID1(RAID配置后的磁盘总容量需大于等于256GB),7.2K RPM 以上机械硬盘,IOPS至少5000次/s ¡ ETCD盘:2*600GB HDD,RAID1(RAID配置后的磁盘总容量需大于等于50GB),7.2K RPM 以上机械硬盘,安装路径:/var/lib/etcd ¡ RAID卡1GB Cache,支持数据掉电保护且超级电容必须在位 · 网口:1个网口,1*10Gbps及以上带宽 |
表4-3 WAN场景SeerAnalyzer数据盘分区规划1
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
2TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
950GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
450GB |
ext4类型 |
表4-4 WAN场景SeerAnalyzer数据盘分区规划2
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
4TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
2200GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
1000GB |
ext4类型 |
仅部署统一数字底盘和SeerAnalyzer+SDWAN融合场景:为GlusterFS预留450GB。如果还部署其它组件,需要各组件确定占用的磁盘容量大小,并在此基础上扩容。
服务器网卡配置需求:
· 普通模型:单网卡模型,1*1Gbps及以上带宽或1*10Gbps及以上带宽。
· 冗余模式(工作模式推荐配置为mode2或mode4):2*1Gbps Linux Bonding或2*10Gbps及以上带宽。
冗余模式配置方式可以参考《H3C 统一数字底盘配置指导》,请根据实际配套情况参考对应版本的配置指导。
· 在部署/升级/重建集群前,请确保排序在Matrix 集群使用的节点IP所在网卡前的所有网卡均已配置IP地址或配置为ONBOOT=no并且网卡状态为DOWN,否则会操作失败。例如,网卡排序为:ens190>ens191,若节点IP所在网卡为ens191,则需确保ens190也已配置IP地址。
· 必须通过ifconfig命令查看网卡的排序。
· 集群中不应存在异常的网卡配置文件,如未接线但配置文件中ONBOOT=yes,未配置IP地址且ONBOOT=yes或网卡状态为UP等。
· 如果集群采用bond作为Matrix主网卡,请确保在Matrix集群中的所有非bond成员的网卡均已配置IP地址或者配置为ONBOOT=no并且网卡状态为DOWN。
· SeerEngine-SDWAN控制组件不需要单独的网络配置。
· 单机部署场景下,License Server不需要单独地址,复用统一数字底盘集群节点IP地址。
· 分析组件的网络配置请参考《SeerAnalyzer安装部署指导》。
· 安全控制组件单机部署场景需要一个容器内网卡IP地址(IPv4),集群部署场景需要三个容器内网卡IP地址(IPv4)。
· 双栈模式下,北向业务虚IP必须在Master节点所处的网段内,分别分配IPv4地址,IPv6地址。北向业务虚IP至少配置一个IPv4或IPv6地址,不可同时配置两个相同协议的IP地址。
IP地址可为IPv4或IPv6。
(1) 单机部署场景下IP地址规划参考表4-5。
表4-5 单机部署场景IP地址规划(单栈)
IP地址类型 |
地址个数 |
说明 |
备注 |
统一数字底盘集群节点IP地址 |
1个 |
必选,部署统一数字底盘的主机IP地址 |
统一数字底盘 |
统一数字底盘北向业务虚IP地址 |
1个 |
必选,统一数字底盘集群对外提供服务的IP地址 |
|
SeerEngine-SEC安全控制组件南向地址 |
2个 |
1个主机地址,1个集群IP地址 |
SeerEngine-SEC安全控制组件 |
仲裁系统 |
1个 |
可选,部署自动倒换模式的异地容灾系统时需要 |
异地灾备的第三方仲裁系统,部署在独立的服务器上,提供异地灾备场景主备自动切换 |
SeerAnalyzer分析组件 |
0个 |
南北向网络合一 |
推荐南北向网络合一,分析组件数据采集共用统一数字底盘的网络,不单独创建附加网络 |
(2) 集群部署场景下IP地址规划参考表4-6。以IPv4单栈为例,集群部署场景下IP地址规划举例如表4-7所示。
表4-6 集群部署场景IP地址规划(单栈)
IP地址类型 |
地址个数 |
说明 |
备注 |
统一数字底盘集群节点IP地址 |
3个 |
必选,部署统一数字底盘的主机IP地址 |
统一数字底盘 |
统一数字底盘北向业务虚IP地址 |
1个 |
必选,统一数字底盘集群对外提供服务的IP地址 |
|
Worker节点IP |
N个(N≥0) |
可选,为Worker节点分配的IP地址 |
|
License Server虚拟IP |
1个 |
License Server配置高可靠,需要增加一个虚拟IP |
License Server |
SeerEngine-SEC安全控制组件南向地址 |
4个 |
3个主机地址,1个集群IP地址 |
SeerEngine-SEC安全控制组件 |
仲裁系统 |
1个 |
可选,部署自动倒换模式的异地容灾系统时需要 |
异地灾备的第三方仲裁系统,部署在独立的服务器上,提供异地灾备场景主备自动切换 |
SeerAnalyzer分析组件 |
0个 |
南北向网络合一 |
推荐南北向网络合一,分析组件数据采集共用统一数字底盘的网络,不单独创建附加网络 |
表4-7 集群部署场景IP地址举例(单栈)
IP地址类型 |
地址个数 |
IP地址 |
备注 |
统一数字底盘集群节点IP地 |
3个(IPv4) |
192.168.40.145 192.168.40.146 192.168.40.147 |
掩码:255.255.255.0 网关:192.168.40.1 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
192.168.40.148 |
|
Worker节点IP |
3个(IPv4) |
192.168.40.149 192.168.40.150 192.168.40.151 |
|
License Server虚拟IP |
1个(IPv4) |
192.168.40.152 |
|
SeerEngine-SEC安全控制组件南向地址 |
4个(IPv4) |
集群地址: 192.168.30.153 主机地址: 192.168.30.154 192.168.30.155 192.168.30.156 |
- |
SeerAnalyzer分析组件 |
0个 |
- |
|
仲裁系统服务器IP |
1个(IPv4) |
192.168.40.160 |
掩码:255.255.255.0 网关:192.168.40.1 |
(1) 开启双栈,单机部署场景下IP地址规划参考表4-8。
表4-8 单机部署场景IP地址规划(双栈)
IP地址类型 |
地址个数 |
说明 |
备注 |
统一数字底盘集群节点IP地址 |
IPv4和IPv6各1个 |
必选,部署统一数字底盘的主机IP地址 |
统一数字底盘 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4或IPv6) |
必选,统一数字底盘集群对外提供服务的IP地址,北向业务虚IP至少配置一个IPv4或IPv6,不可同时配置两个相同协议的IP。 |
|
SeerEngine-SEC安全控制组件南向地址 |
不支持双栈 |
不支持双栈 |
SeerEngine-SEC安全控制组件 |
仲裁系统 |
1个(IPv4或IPv6) |
可选,部署自动倒换模式的异地容灾系统时需要 |
异地灾备的第三方仲裁系统,部署在独立的服务器上,提供异地灾备场景主备自动切换 |
SeerAnalyzer分析组件 |
0个 |
南北向网络合一 |
推荐南北向网络合一,分析组件数据采集共用统一数字底盘的网络,不单独创建附加网络 |
(2) 开启双栈,集群部署场景下IP地址规划参考表4-9所示。
表4-9 集群部署场景IP地址规划(双栈)
IP地址类型 |
地址个数 |
说明 |
备注 |
统一数字底盘集群节点IP地址 |
IPv4和IPv6各3个 |
必选,部署统一数字底盘的主机IP地址 |
统一数字底盘 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4或IPv6) |
必选,统一数字底盘集群对外提供服务的IP地址,北向业务虚IP至少配置一个IPv4或IPv6,不可同时配置两个相同协议的IP |
|
Worker节点IP |
N个(N≥0,IPv4和IPv6) |
可选,为Worker节点分配的IP地址 |
|
License Server虚拟IP |
IPv4和IPv6各1个 |
License Server配置高可靠,需要增加一个虚拟IP |
License Server |
SeerEngine-SEC安全控制组件南向地址 |
IPv4和IPv6各4个 |
3个主机地址,1个集群IP地址 |
SeerEngine-SEC安全控制组件 |
仲裁系统 |
1个(IPv4或IPv6) |
可选,部署自动倒换模式的异地容灾系统时需要 |
异地灾备的第三方仲裁系统,部署在独立的服务器上,提供异地灾备场景主备自动切换 |
SeerAnalyzer分析组件 |
0 |
南北向网络合一 |
推荐南北向网络合一,分析组件数据采集共用统一数字底盘的网络,不单独创建附加网络 |
统一数字底盘和License Server的具体安装步骤请参见《H3C 统一数字底盘部署指导》。推荐选取两台服务器勾选安装License Server,配置License Server HA。
· 请不要删除各组件当前部署版本的安装包。
· 对于使用内置NTP服务器的场景,在部署集群之前,需确保所有节点的系统时间和当前时间保持一致。对于使用外置NTP服务器作为时钟同步源的场景,需确保外置NTP服务器的时间与当前时间保持一致。如果NTP服务器网络不通、出现故障或时间不准确时,可能导致Matrix集群、Portal组件等部署失败。
· 查看及修改节点系统时间的命令如下:date(查看系统时间);date-s yyyy-mm-dd(修改系统时间的年月日);date-s hh:mm:ss(修改系统时间的时分秒)。
· 通过lsblk命令查看当前磁盘分区信息,请确保所选的磁盘或分区没有被挂载或使用。
· 为GlusterFS应用准备的磁盘不能被格式化,否则会安装失败。若该磁盘被格式化,则可通过“wipefs -a /dev/磁盘名称”命令清空磁盘来进行修复。
· 若执行“wipefs -a /dev/磁盘名称”命令时,提示错误:“探测初始化失败:设备或资源忙”,需要等待一段时间再执行一次。
· GlusterFS 使用的分区必须是标准分区。
· 在AD-WAN分支方案中,统一数字底盘部署时请选用标准模式部署。
参考《H3C统一数字底盘部署指导》,创建Matrix集群。
使用系统缺省的admin用户(默认密码:Pwd@12345)登录Matrix(登录网址:https://ip_address:8443/matrix/ui),其中“ip_address”为北向业务虚IP地址。
进入[部署>应用]页面,选择“部署应用”,单击<上传>按钮,先批量上传安装包,需要上传并安装的安装包如表5-1所示。
安装包名称 |
功能说明 |
方案选择 |
融合部署依赖 |
UDTP_Middle_<version>.zip |
中间件镜像库 |
必选 |
广域网分支 |
UDTP_GlusterFS_<version>.zip |
提供产品内本地共享存储功能 |
必选 |
广域网分支 |
UDTP_Core_<version>_x86.zip |
门户、统一认证、用户管理、服务网关、帮助中心、权限、资源身份、License、配置中心、资源组、日志服务 |
必选 |
广域网分支 |
BMP_IMonitor_<version>_x86.zip |
提供自监控服务 |
必选(SDWAN R6810H03以下版本必选) |
广域网分支(SDWAN R6810H03以下版本必选) |
BMP_Report_<version>_x86.zip |
报表 |
必选 |
广域网分支 |
BMP_Alarm_<version>_x86.zip |
提供告警服务 |
必选 |
广域网分支 |
BMP_WebSocket_<version>_x86.zip |
南向Websocket功能 |
必选 |
广域网分支 |
BMP_Dashboard_<version>_x86.zip |
大屏框架 |
必选 |
广域网分支 |
BMP_Widget_<version>_x86.zip |
平台大屏Widget |
必选 |
广域网分支 |
BMP_Template_<version>_x86.zip |
模板服务 |
必选 |
广域网分支 |
BMP_QuickReport_<version>_x86.zip |
快速报表 |
必选(SDWAN R6810H03以下版本必选) |
广域网分支(SDWAN R6810H03以下版本必选) |
BMP_OneClickCheck_<version>_x86.zip |
健康检查 |
必选 |
广域网分支 |
BMP_Subscription_<version>_x86.zip |
订阅服务 |
必选 |
广域网分支 |
BMP_RDR_<version>_x86.zip |
异地容灾 |
可选 |
否 |
NSM_FCAPS-Res_<version>_x86.zip |
网络设备的发现、纳管和基本信息管理 |
必选(融合部署) |
广域网分支 |
NSM_FCAPS-Topo_<version>_x86.zip |
自定义拓扑、IP拓扑 |
必选(手工部署) |
否 |
NSM_FCAPS-Perf_<version>_x86.zip |
网络性能监控 |
必选(手工部署) |
否 |
NSM_FCAPS-ICC_<version>_x86.zip |
设备备份、恢复、版本升级 |
必选(手工部署) |
否 |
NSM_FCAPS-Asset_<version>_x86.zip |
网络资产管理 |
必选(手工部署) |
否 |
NSM_FCAPS-Webdm_<version>_x86.zip |
设备面板 |
可选(手工部署) |
否 |
NSM_Tools_<version>_x86.zip |
SSH代理登录工具、Mib Browser工具 |
可选 |
否 |
WAN_WVAS_<version>_x86.zip |
QoS管理服务 |
必选 |
广域网分支 |
H3C_SEERENGINE_SDWAN-<version>.zip |
为系统提供广域网分支网络管理服务 |
必选 |
否 |
SeerEngine-SEC-<version>.zip |
安全控制组件 |
可选 |
否 |
Analyzer-AI-<version>_x86_64.zip |
AI智能预测组件 |
SeerAnalyzer+SDWAN融合场景下为必选 |
否 |
Analyzer-Collector-<version>_x86_64.zip |
公共采集组件 |
SeerAnalyzer+SDWAN融合场景下为必选 |
否 |
Analyzer-Diagnosis-<version>_x86_64.zip |
诊断分析组件 |
SeerAnalyzer+SDWAN融合场景下为必选 |
否 |
Analyzer-Platform-<version>_x86_64.zip |
基础平台组件 |
SeerAnalyzer+SDWAN融合场景下为必选 |
否 |
Analyzer-Telemetry-<version>_x86_64.zip |
指标分析组件 |
SeerAnalyzer+SDWAN融合场景下为必选 |
否 |
Analyzer-WAN-<version>_x86_64.zip |
WAN应用分析组件 |
SeerAnalyzer+SDWAN融合场景下为必选 |
否 |
参考《H3C 统一数字底盘部署指导》,完成统一数字底盘的安装。
统一数字底盘提供友好的GUI界面。完成统一数字底盘的安装后,可按照如下方式登录统一数字底盘。
(1) 在浏览器中输入统一数字底盘登录地址(默认登录地址:http://ip_address:30000/central),回车后会进入如图5-1所示登录界面。
¡ ip_address:统一数字底盘所在Matrix的集群北向业务虚IP地址。
¡ 30000:端口号。
(2) 输入操作员名称和密码,缺省用户名为admin,默认密码为Pwd@12345。
· 统一数字底盘自E0713版本开始,不推荐在统一数字底盘部署管理页面部署组件,推荐在Matrix融合部署页面部署组件。
· 请按照部署顺序依次部署对应组件。
· 融合部署页面卸载应用组件时,卸载SDWAN依赖组件时,会将SDWAN一同卸载,请谨慎操作。
· 安装介质的名称,比如NSM_FCAPS-Res_E0715_x86.zip,名称不可以修改。
· 在应用部署、升级过程中,不能重启matrix服务、不能重启节点,不能断开服务器电源,否则会造成应用部署数据出现损坏(例如etcd数据错误、磁盘文件损坏等),造成应用部署、升级失败。
· 网络资源支持租户隔离。自定义拓扑、ICC、网络监控暂不支持租户隔离。
· 部署network的集群场景,每个运行influxdb服务的节点在重建加入集群后,都需在该节点上执行/opt/matrix/app/install/metadata/UCENTER/kernel/network/perf/scripts/major2standby.py用于恢复网络监控数据的完整性。如果运行influxdb服务的节点1重建,未执行major2standby.py后继续重建运行influxdb服务的节点2,那么性能数据将丢失。
· U-Center 2.0 NSM 不支持通过浏览器头部的“前进”或者“后退”按钮访问已经浏览过的历史页面;如需查看统一数字底盘的某一个页面,请通过菜单浏览。
(1) 使用admin用户(默认密码:Pwd@12345)登录Matrix(登录网址:https://ip_address:8443/matrix/ui)。其中“ip_address”为北向业务虚IP地址。
(2) 进入[部署 > 融合部署]页面,选择“安装”,进入应用选择页面,参考表5-1,勾选所有必选NSM基础网管组件的组件进行部署。单击<下一步>按钮进入安装包选择界面。
图6-1 部署应用页面
图6-2 选择安装包
(3) 在安装包选择页面,选择对应组件的应用包版本号。单击<下一步>按钮进入参数配置界面。
图6-3 安装包选择
(4) 在配置参数页面根据组件需求,配置相关参数。配置完成后单击<部署>按钮,即可开始进行NSM基础网管组件部署。
图6-4 部署NSM基础网管组件
(1) 使用admin用户(默认密码:Pwd@12345)登录Matrix(登录网址:https://ip_address:8443/matrix/ui)。其中“ip_address”为北向业务虚IP地址。
(2) 单击[部署>融合部署]菜单项,进入融合部署页面。如图6-5所示。
单击<安装包管理>按钮,进入安装包管理页面。该页面支持对安装包进行上传、删除等操作。上传完成的安装包将展示名称、版本、大小、创建时间等信息。如图6-6页面所示。应用安装包支持批量上传。安装包上传完成后,单击,返回融合部署页面。
融合部署页面单击<安装>按钮,进入应用选择页面。在应用选择页面勾选广域网分支应用(其依赖的应用会被默认勾选,应用间的依赖关系请参见图6-7),参考表5-1勾选需要安装的组件,单击<下一步>按钮,进入安装包选择页面。
在安装包选择页面,支持选择应用包版本号,如图6-8所示。单击<下一步>按钮,进入参数配置页面。
· 列表存在Worker节点时,才可以进行节点绑定选择,节点绑定时,请确保所选择绑定的节点状态正常。
· SeerEngine-SDWAN控制组件只能选择绑定1个或3个节点,且Master和Worker节点不能同时勾选。
· 若需要部署SDWAN MSP场景,请开启MSP场景部署开关。
在参数配置页面可根据各组件需求,配置相关参数。配置完成后单击<部署>按钮,即可开始部署组件。
若需要部署SDWAN MSP场景,请开启MSP场景部署开关。
图6-9 QoSM应用参数配置
图6-10 SeerEngine-SDWAN控制组件参数配置
控制器安装完成后建议调整limit值,请参见附录11.1 调整websocket、kafka内存limit值。
· 不建议修改系统时间,建议部署控制组件软件前先在服务器上部署NTP时钟同步。如果需要在安装控制组件后修改系统时间,建议在系统时间修改完毕后重启服务器。
· SeerEngine-SEC控制组件使用所在服务器操作系统的Hostname作为关键参数标志控制组件集群成员,控制组件安装完成后,请不要再对操作系统的主机名进行修改,如需修改,请联系售后工程师。
· 安全控制组件需要绑定网络。
(2) 单击[系统 > 部署管理]菜单项,进入部署管理页面,单击<安装>按钮,进入部署向导页面。单击<上传>按钮,进入上传安装包页面,在弹出窗口中选择并上传相应的安装包。
图6-12 部署管理页面
图6-13 部署向导页面
图6-14 上传安装包页面
(3) 安装包上传完毕后,单击<下一步>按钮,进入组件选择页面,在“控制组件”的下拉菜单中勾选“安全控制组件”,选择对应版本的安装包,单击<下一步>按钮。
图6-15 组件选择页面
(4) 继续单击<下一步>按钮至网络配置页面,创建绑定网络和子网,用于分配安全控制组件的互联IP地址。
图6-16 创建网络
· 子网网关需真实存在,且与设备路由可达。
· 添加主机节点选择上行口:选择Matrix集群的节点IP所在的网卡。
(5) 继续单击<下一步>按钮至网络绑定页面,选择创建好的网络和子网完成绑定。
图6-17 网络绑定页面
(6) 单击<下一步>按钮至参数确认页面,确认集群IP和容器内网卡IP地址无误后单击<部署>按钮,进行安全控制组件部署,如图6-18所示。
图6-19 安全控制组件部署完成
在SeerAnalyzer+SDWAN融合场景中,SeerAnalyzer分析组件不支持独立部署,仅支持SeerEngine-SDWAN控制组件和SeerAnalyzer分析组件融合部署,并且需要优先安装SeerEngine-SDWAN控制组件。
具体安装步骤请参见《H3C SeerAnalyzer 安装部署指导》。
目前各组件均支持试用License,可以直接使用试用License进行测试。
现网实际部署时需要注册正式License,关于授权的申请和安装过程,请参见《H3C 软件产品远程授权License 使用指南》。
License Server和统一数字底盘是一对一的关系,一个License Server只能被一个统一数字底盘环境使用。
在License Server上安装产品的授权后,只需在产品的License管理页面与License Server建立连接即可获取授权,操作步骤如下:
(2) 单击[系统 > License管理 > License信息]菜单项,进入License信息页面,如图7-1所示。
(3) 配置如下信息:
¡ IP地址:License Server所在服务器的IP地址。
¡ 端口号:缺省值为5555,与License Server授权服务端口号保持一致。
¡ 客户端名:License Server中配置的客户端名称。
¡ 客户端密码:License Server中配置的客户端名称对应的密码。
¡ 单击<连接>按钮,与License Server建立连接,连接成功后可自动获取授权信息。
控制组件支持备份恢复功能,可以通过页面备份并恢复控制组件数据。
使用admin账号登录控制组件,进入[系统 > 备份恢复]页面,单击<备份参数配置>按钮,在弹出窗口中设置备份参数,如图8-1所示。
关键参数说明:
· 前缀名:指的是备份后的文件名前缀。
· 文件个数:指的是保留文件总个数。
· 远端备份:打开即开启远端备份。
· 传输协议:支持FTP和SFTP协议,选择FTP协议。
· 协议端口:指的是FTP或SFTP的服务端口。
· 服务器IP:指的是远端备份服务器的IP地址。
· 文件路径:指的是备份文件的存储路径,需要注意的是root用户可以写绝对路径,普通用户只能写相对路径。
· 用户名/密码:FTP连接使用的用户名和密码。
· 远端数据清理:是否开启远端数据清理功能。
· 定时备份:是否开启定时备份功能。
· 频率/时间:定时备份的频率和备份时间。
· 清理:远端数据清理开关。
· 文件路径:表示从远端传输过来的备份文件的存放路径,必须是绝对路径。
· 清理策略:表示按照备份文件的个数或者按照天数,保留备份文件的数量,清理时间是每隔一个小时轮询清理一次。
· 定时备份:是否开启定时备份功能。
· 频率/时间:定时备份的频率和备份时间。
· 底盘数据备份:是否开启对底盘运维数据及license数据进行备份功能。
· 性能监控数据备份:对网络设备监控中,根据性能指标采集而产生的监控数据进行备份。
· Trap数据备份:对系统接收到的Trap数据进行备份。
· 告警数据备份:对系统中活动告警和历史告警数据进行备份。
· License数据备份:对License数据进行备份。
· 磁盘评估:在备份或者恢复之前,判断master节点备份恢复工作目录所在的磁盘分区利用率是否大于等于85%,分区利用率小于85%的情况下,继续判断本次备份或者恢复预估需要占用空间大小(4倍的数据文件大小)加上备份恢复工作目录所在的磁盘分区已使用的空间大小除以工作目录所在分区的总空间是否大于等于85%,如果磁盘利用率大于等于85%或者计算出的比例大于等于85%,终止本次的备份或者恢复。
· 超时时间:单个组件一次备份/恢复操作允许执行的最长时间。超过此时长,则认为本次备份/恢复操作失败。
根据备份参数设置,系统可以自动执行备份,用户也可以手动进行备份。
操作步骤如下:
(1) 使用系统默认的admin用户登录控制组件集群,进入[系统 > 备份恢复]页面。
(2) 单击<开始备份>按钮,选择SYSTEM和SeerEngine-SDWAN两个组件执行备份操作,如图8-2所示。
(3) 等待一段时间后备份完成。主用控制组件集群提示备份完成后,后台还在执行远端备份,即将该备份文件SFTP传输到备用控制组件集群,远端备份完成后,也会弹窗提示完成。因文件大小和传输速度不同,远程备份时间长短不一,请耐心等待。
(4) 备份完成后,页面会显示备份记录,如图8-3所示。其中后面“_M”后缀表示手动备份的文件,“_A”后缀表示自动备份的文件。
图8-3 备份记录
· 若有多个组件的备份文件需恢复,请务必先恢复SYSTEM组件备份文件,再恢复其他组件的备份文件。
· 若多个组件的数据之间存在关联,请使用同一时间备份的备份文件进行恢复。
· 恢复过程中请勿关闭和刷新页面。
(1) 使用系统默认的admin用户登录备控制组件集群,进入[系统>备份恢复]页面,单击选择备份文件,单击<上传>按钮进行上传。
(2) 上传完成后,单击<开始恢复>按钮进行恢复,如图8-4所示,请耐心等待恢复完成,恢复过程中请勿关闭或刷新此页面。
(3) 恢复完成后,检查环境对应数据是否已经恢复成功。
使用系统默认的admin用户登录备控制组件集群,进入[系统>备份恢复]页面,在备份历史找到需要恢复的备份文件,单击列表操作列的恢复按钮执行恢复,需要对SYSTM备份文件和SeerEngine-SDWAN备份文件进行恢复,如图8-5所示。耐心等待恢复完成。
恢复完成后,检查环境对应数据是否已经恢复成功。
为了实现高可靠性,SeerEngine-SDWAN控制组件支持3+3灾备部署模型。部署两套相同版本的集群环境,其中一套作为主用集群环境,另一套作为备用集群环境。
主备集群安装的组件和版本必须保证完全一致,且主备集群各节点的主机名也需要保证一致,否则网络相关数据可能恢复失败。
主备集群使用的服务器需要保持一致,包括硬盘、内存和网卡等配置信息。
图9-1 组网图
· 图中绿色实线代表统一数字底盘服务器使用的物理链路,SeerEngine-SDWAN控制组件、SeerEngine-Campus控制组件和SeerEngine-SEC安全控制组件都可以复用此物理连线。
· 图中蓝色实线代表SeerAnalyzer分析组件使用的物理链路,SeerAnalyzer分析组件和统一数字底盘不能使用同一网段,因此建议通过不同物理网卡区分。
· 主集群和备集群各Node节点使用的网卡必须保持一致,如果使用聚合网卡,聚合网卡名称也必须一致。
主备集群使用的RAID和分区规划需要保持一致。
具体RAID和分区规划可以参考4.2 磁盘RAID和分区规划。
通用场景下主备集群需要部署在两个不同的机房,因此需要规划两套集群地址。
主备集群地址的数量和要求相同,具体地址需求可以参考4.3 IP地址规划。
主备集群分别完成统一数字底盘安装,需要保证安装的组件和版本完全一致,安装需求参考5 统一数字底盘安装和部署。
主备集群分别完成SeerEngine-SDWAN控制组件部署,需要保证SeerEngine-SDWAN控制组件版本一致,安装流程参考6 应用组件部署。
主备集群需要分别注册License,License注册步骤参考7 软件注册。
(1) 使用系统缺省的admin用户(默认密码:Pwd@12345)登录Matrix(登录网址:http://ip_address:8443/matrix/ui)。
(2) 进入[系统>安全>安全策略]页面,单击<新增>按钮,进入新增安全策略页面,单击<新增>按钮,增加一条新的规则,协议类型选择为TCP,目标端口为19443,动作拒绝,如图9-2所示,禁止设备访问集群的WebSocket服务。
(3) 单击<应用>按钮完成规则添加,显示新增策略,如图9-3所示。单击<应用>按钮完成策略添加。
(4) 在安全策略页面单击对应策略后面的启用按钮,启用安全策略。安全策略启用后如图9-4所示,WebSocket服务被阻止。
SeerEngine-SDWAN控制组件纳管设备时需要补充配置,将备集群的统一北向地址配置为WebSocket注册地址,使设备能够从主集群切换连接到备集群。
登录设备,增加配置命令如下:
cloud-management backup-server domain 192.168.30.145 port 19443 //灾备集群统一北向地址
图9-5 配置WebSocket注册地址
· 远程备份的“服务器IP”填写备环境的北向虚IP,“用户名”和“密码”为备环境上配置的SFTP服务登录的用户名和密码。
· 建议开启定时备份,定时备份结果将会自动远程传输到备环境中。
(1) 使用非root用户传输时的SFTP服务配置
· 如果需要使用root用户进行SFTP传输,root用户和密码在安装操作系统时已经配置,无需再创建,可跳过该步骤。
· 如果需要使用非root用户进行SFTP传输,在不动任何SFTP以及SSH配置文件的情况下新建用户以及路径参考配置如下。
a. SSH登录主备环境每个Master节点的后台,然后执行如下命令:
useradd remote (账号名)
passwd remote 更改密码
chown remote:remote /home/remote/
chmod 755 /home/remote/
mkdir /home/remote/upload
chmod 755 /home/remote/upload/
chown remote:remote /home/remote/upload/
chmod 755 /home/remote/upload/(路径)
图9-6 新建用户以及路径参考配置
(2) 登录主环境,根据页面提示配置备份参数,开启远端备份。
图9-7 配置主环境备份参数
(3) 登录备环境,进入[备份恢复]页面,开启远端备份,填写“服务器IP”、“文件路径”、“用户名”和“密码”。
· 备环境上的“用户名”、“文件路径”需要和主环境上填写的值,严格保持一致。否则在备环境中单击<同步文件>按钮,会显示同步文件失败。
· 备环境上的“服务器IP”需填写真实可达的SFTP服务器IP。“密码”需填写“用户名”对应的密码。
· 备环境上的“服务器IP”和“密码”字段需填写真实可达的“服务器IP”和“密码”,否则同步文件功能将不能正常使用。
图9-8 配置备环境备份参数
(1) 在主环境单击<开始备份>按钮,勾选对应组件,单击<备份>按钮,开始备份。备份完成后,进行下一步。
图9-9 执行备份
(2) 查询备份配置中心的regionid,并记录regionid:
a. 访问http://IP地址:端口号/confcenterrs/swagger-ui.html,输入信息查询regionid,如图9-10所示。
b. 获取regionid,如图9-11所示。
(1) 组件备份完成后。若开启了远端备份,备份文件会自动远程传输到备环境上主Master节点的对应的路径下,主环境页面会提示远程传输成功。
(2) 传输完成后,可到备环境主Master节点对应的文件路径下查看文件是否存在。
图9-12 确认文件存在
· 远程传输报文使用的源地址是backup-pod-xxxxxxxxx-xxxxx所在节点的节点IP,不是主环境的北向业务虚IP,且Pod可能会在3个Master节点之间漂移,导致远程传输使用的源IP是3个节点IP中的某一个,不固定。目的地址是页面配置的“服务器IP”。
· 若网络中有防火墙等安全设备,需要对应放开这3个IP,以免传输失败。
(1) 在备环境的备份恢复页面上,单击<同步文件>按钮,将远端备份文件从自定义路径同步到各Master节点的/opt/matrix/app/data/base-service/backupRecovery/historyFiles/目录下,同步完成后,主环境的备份文件显示在页面的备份历史列表中。
图9-13 同步文件
¡ 当远端备份开启时,是将主环境传输过来的备份文件(文件是在自定义配置的路径下),同步到备环境所有Master节点的/opt/matrix/app/data/base-service/backupRecovery/historyFiles/目录下。
¡ 当远端备份关闭时,是将本环境各Master节点的/opt/matrix/app/data/base-service/backupRecovery/historyFiles/目录下文件进行同步,使得各Master节点此目录下文件保持一致。
¡ 当文件同步到backup-pod-xxxxxxxxx-xxxxx所在节点的/opt/matrix/app/data/base-service/backupRecovery/historyFiles/目录下后,备份恢复的备份历史列表中才会显示出对应的文件。
当主环境出现故障需要使用备环境时,可执行以下步骤,在备环境上恢复主环境备份的数据。
(1) 根据上述步骤获取的配置中心ID,恢复配置中心的regionid。请求接口和配置参数,如图9-14所示。
(2) 在备环境的[备份恢复]页面,单击主环境远端备份传输备份文件列表操作列“恢复”按钮,执行恢复。耐心等待恢复完成,期间不要关闭或刷新此页面。
· 若有多个组件的备份文件需恢复,请务必先恢复SYSTEM组件备份文件,再恢复其他组件的备份文件。
· 若多个组件的数据之间存在关联,请使用同一时间备份的备份文件进行恢复。
图9-15 执行恢复
若License Server是独立服务器搭建的(即不是安装在主环境的某个节点上)。在备环境上执行恢复后,连接信息也会恢复,备环境会自动尝试连接上原License Server,获得授权。如果发现连接异常,可手动断开后重新连接。如果断开连接失败,可能是因为重连定时器将锁占用了,请稍后重试。
若原主环境Portal页面仍可登录,可打开License管理菜单,断开License连接。如果原主环境无法登录,可登录License Server页面,将主环境的客户端强制下线。
若License Server是安装在主环境的某个节点上。主环境故障,License Server将不可用,需要另行准备License Server供备环境连接,准备方法同原主环境。
停止主集群的WebSocket服务,配置过程参考9.6 禁用备集群WebSocket服务。
使用系统缺省的admin用户(默认密码:Pwd@12345)登录Matrix(登录网址:https://ip_address:8443/matrix/ui),进入[系统>安全>安全策略]页面,在安全策略页面单击对应策略后面的禁用按钮,禁用安全策略,如图9-16所示。安全策略禁用后,WebSocket服务被放通。
· 如果有保持原北向IP不变的需求,可通过修改北向IP,使得备环境的北向IP为主环境的北向IP。
· 停用主环境(可以在主环境的Matrix页面修改北向IP为其他地址或者直接关机下电),确保主环境的北向业务虚IP空闲出来。
登录备环境的Matrix页面,修改其北向业务虚IP为主环境的北向IP,方法如下:
(1) 使用备环境的主Master节点的IP,打开Matrix页面。
(2) 打开[部署>集群>集群参数]页面,单击[修改]按钮。
图9-17 集群参数页面
(3) 勾选下面的[高级]选项,修改“北向业务虚IP”为主环境的北向业务虚IP,然后单击右上角的[应用]按钮,耐心等待执行完成。
图9-18 修改集群参数页面
图9-19 修改集群参数
图9-20 应用集群参数
(4) 修改成功后,可以通过修改后的北向IP登录备环境。
恢复完成后,备环境的备份参数会被恢复为主环境的配置。请重新配置为正确合理的值。
· 建议开启备环境的远端备份功能,并填写新的SFTP服务器。
· 建议开启备环境的定时备份功能。
恢复完成后,登录节点的远程控制台,后台查看所有pod的运行状况,无异常(pod状态都为Running或者Completed)。查询节点状态命令:kubectl get pods --all-namespaces
检查各菜单是否能够正常打开,数据是否恢复成功,各功能是否正常。
确认一切正常后,可将主环境从网络中断开连接、下电、维修。
异地灾备系统是指处于异地的两个站点之间进行主备灾备,主备站点上的组件之间互为备份。异地灾备系统正常运行时,对外提供服务站点的数据实时向对端站点同步,确保两站点间的数据一致。用户可通过界面操作配置手动或者带仲裁的自动倒换,当对外提供服务的站点出现故障时,例如整站点断电、站点网络故障、站点和外界相连的链路故障等,故障站点的业务可被另一个站点接管,保持业务连续性,减少损失。
· 主备集群需要在所有节点操作系统SSH端口为22且统一数字底盘访问协议、访问端口、K8S的Service IP地址池、容器IP地址池配置一致的前提下建立容灾关系。
· 若在异地容灾场景下使用系统访问控制功能,建议白名单取两边并集。否则重建容灾关系后需要重新录入白名单配置。
· 主站点北向断网后,备站点接管,当主站点恢复后,会存在两个主站点。需要对其中一个集群做物理网络隔离,防止出现双主站点,影响南向业务正常运行。
· 当前异地容灾不支持主备集群使用各自的Licesne Server和授权信息。
· 使用异地容灾模式,需要把License Server部署在集群外独立服务器或者虚拟机上,不能部署在集群内的节点上。
在创建灾备系统过程中,请保证主备站点间的网络通信状态符合如下表10-1中的要求,否则可能会导致灾备配置失败。
网络 |
具体要求 |
主备站点之间内部通信网络 |
时延<500ms,带宽>=100Mbps |
主备站点到仲裁节点之间通信网络 |
时延<500ms,带宽>=10Mbps |
若灾备站点之间存在防火墙,如图10-1所示,请在防火墙侧放通相关端口。主备集群控制组件之间需要双向放通,涉及的端口参见表10-2。仲裁服务器与主集群、备集群之间也需要双向放通,涉及的端口参见表10-3。主备服务器集群和License Server之间需要放通,涉及的端口参见表10-4。
组件 |
源IP |
源端口 |
目的IP |
目的端口 |
协议 |
目的端口是否可更改 |
端口说明 |
SDWAN控制组件 |
主集群服务器节点IP 主集群控制组件北向虚IP |
任意 |
备集群控制组件北向虚IP |
21500 |
TCP |
否 |
控制组件数据同步使用 |
备集群服务器节点IP 备集群控制组件北向虚IP |
任意 |
备集群控制组件北向虚IP |
21500 |
TCP |
否 |
控制组件数据同步使用 |
|
统一数字底盘 |
主集群服务器节点IP 主集群控制组件北向虚IP |
任意 |
备集群控制组件北向虚IP |
11181 |
TCP |
否 |
灾备心跳网络的端口 |
备集群服务器节点IP 备集群控制组件北向虚IP |
任意 |
主集群控制组件北向虚IP |
11181 |
TCP |
否 |
灾备心跳网络的端口 |
|
主集群服务器节点IP 主集群控制组件北向虚IP |
任意 |
备集群控制组件北向虚IP |
4407、4408、4409、SSH端口 |
TCP |
否 |
底盘pxc灾备数据同步端口 |
|
备集群服务器节点IP 备集群控制组件北向虚IP |
任意 |
主集群控制组件北向虚IP |
4407、4408、4409、SSH端口 |
TCP |
否 |
底盘pxc灾备数据同步端口 |
|
主集群服务器节点IP 主集群控制组件北向虚IP |
任意 |
备集群控制组件北向虚IP |
20180 |
TCP |
否 |
底盘pg灾备数据同步端口 |
|
备集群服务器节点IP 备集群控制组件北向虚IP |
任意 |
主集群控制组件北向虚IP |
20180 |
TCP |
否 |
底盘pg灾备数据同步端口 |
|
分析组件 |
主集群服务器节点IP 主集群控制组件北向虚IP |
任意 |
备集群控制组件北向虚IP |
5400/5500 |
TCP |
否 |
分析器和采集pg灾备数据同步端口 |
备集群服务器节点IP 备集群控制组件北向虚IP |
任意 |
主集群控制组件北向虚IP |
5400/5500 |
TCP |
否 |
分析器和采集pg灾备数据同步端口 |
组件 |
源IP |
源端口 |
目的IP |
目的端口 |
协议号 |
端口是否可更改 |
端口说明 |
统一数字底盘 |
主集群服务器节点IP 主集群控制组件北向虚IP |
任意 |
仲裁服务器IP地址 |
11181 |
TCP |
否 |
仲裁网络的端口 |
表10-4 服务器集群和License Server之间防火墙放通端口策略
组件 |
源IP |
源端口 |
目的IP |
目的端口 |
协议号 |
端口是否可更改 |
端口说明 |
License Server |
主集群服务器节点IP 主集群控制组件北向虚IP |
任意 |
License Server的IP(单机) License Server HA的IP(集群) |
5555 |
SSL |
是 |
异地灾备建议License单独部署 控制组件和License Server通信的端口,端口用户可以自定义 |
· 容灾关系建立、拆除和主备倒换过程中,对集群节点进行断电、重启和断开网络连接等操作,会有概率造成数据损坏,导致容灾关系建立失败,备集群不可用。此时,可使用历史备份文件在备集群后台执行数据恢复操作来修复备集群,待修复完成,备集群可用后,再次尝试建立容灾关系。
· 容灾关系建立后,不允许执行应用的安装、卸载和升级操作。如需执行,请先拆除容灾关系。再对各组件进行升级,升级完成后重新建立容灾关系。
· 容灾关系建立后,不允许修改集群节点IP、内部虚IP、北向虚IP和NTP服务器配置。如需修改,请先拆除容灾关系。
· 在创建灾备系统过程中,请保证主备站点间的网络连接处于正常状态,否则可能导致配置失败;若配置失败,请先确认网络连接是否正常。
· 主备站点的统一数字底盘版本需要一致,并配置相同的HTTP或HTTPS传输协议。
· 如需使用带仲裁的自动倒换模式,需要提前在独立服务器上部署仲裁服务。
· 异地灾备功能不支持主备站点使用不同的IP版本。
· 不支持同时在主备站点创建灾备系统。
· 创建灾备系统时,备站点的用户名及密码必须与当前登录的主站点相同。站点密码最长32个字符;站点用户名有效长度为2~32个字段,只能包含字母、数字、“_”、“-”、“.”和“\”,不区分大小写。
· 灾备系统页面的数据不支持备份恢复,包括:主备站点名称、主备站点IP、备站点用户名密码、仲裁站点IP等。
· 若在异地灾备场景下使用系统访问控制功能,需保证在主站点上添加自身站点和备站点所有节点的IP地址,在备站点上添加自身站点和主站点所有节点的IP地址。
· 请勿在增加或删除容灾组件期间执行任何业务操作。
· 在带仲裁的自动倒换模式下,主备站点和部署了仲裁服务的仲裁站点共同构成一个仲裁系统。当仲裁系统中半数以上的节点存在异常时,仲裁系统不可用。
如需使用带仲裁的自动倒换模式,在独立服务器上部署仲裁服务,具体部署步骤请参见《H3C统一数字底盘部署指导》。
进入[自动化>分支网络>参数配置>模板管理>WebSocket模板]页面,在 WebSocket连接控制组件地址中增加备站点的Matrix北向业务虚IP,单击<确定>按钮保存。后续添加站点时需选择该模板。如图10-2所示。
图10-2 增加备站点的Matrix北向业务虚IP
对于已上线设备需要批量下发该配置,进入[自动化>分支网络>维护保障>批量配置下发]页面,选择设备,输入以下命令,单击<发送>按钮下发,检查是否都下发成功,下发失败的设备需要手动在设备上补充。如图10-3所示。
cloud-management backup-server domain 192.168.30.145 port 19443 //备站点的Matrix北向业务虚IP
图10-3 批量下发Websocket备连接配置
使用系统默认的admin用户登录统一数字底盘,进入[系统>License管理>License连接]页面,配置License Server信息,如图10-4所示页面,单击<确认>按钮,连接License Server。
(1) 使用系统默认的admin用户登录统一数字底盘,进入[系统>应急管理>异地容灾]页面,配置容灾关系参数,如图10-5和图10-6所示页面。
关键参数说明:
¡ 主站点IP:主站点的Matrix北向业务虚IP。
¡ 备站点IP:备站点的Matrix北向业务虚IP。
¡ 备站点用户名和密码:备站点登录统一数字底盘的用户名和密码。
¡ 倒换模式:
- 手动模式:灾备系统不会自动监测主站点和备站点上的组件状态,由用户控制和指定组件在站点上的主用或备用状态,可以通过接管和降备功能,切换组件在站点上主用或备用状态。使用手动模式时,需要在主备站点上各部署一套相同版本的统一数字底盘。
- 带仲裁的自动倒换模式:灾备系统会自动监测组件状态,若站点的组件发生故障,例如站点断电、网络故障等,灾备系统会通过仲裁站点上的仲裁服务,自动切换组件在不同站点上的状态。使用带仲裁的自动倒换模式需要在主备站点上各部署一套相同版本的统一数字底盘,注意选择该模式时需要在独立服务器上部署仲裁服务作为仲裁站点。
¡ 仲裁站点IP:10.2.1 在独立服务器上部署仲裁服务(可选)步骤中的服务器IP。
¡ 异地容灾系统虚IP配置:异地灾备系统提供用于业务对接的统一公共虚ip,使用该IP只会连接到当前灾备系统的主用站点。
¡ 数据同步虚IP:该IP用于灾备系统主备站点的数据同步。
¡ 心跳链路连接状态:建立灾备系统后,主站点向备站点实时发送心跳报文,建立心跳链路,实时监测主备站点之间的网络连接状态。
(2) 单击<连接>按钮,可创建灾备系统的站点配置。页面如图10-7所示。
(3) 单击容灾关系配置区域的<增加>按钮,在弹出的对话框中完成容灾关系配置,逐一增加容灾关系。如图10-8所示。请勿在增加或删除容灾组件期间执行任何业务操作。
· 容灾关系建立、拆除和主备倒换过程中,对集群节点进行断电、重启和断开网络连接等操作,会有概率造成数据损坏,导致容灾关系建立失败,备集群不可用。此时,可使用历史备份文件在备集群后台执行数据恢复操作来修复备集群,待修复完成,备集群可用后,再次尝试建立容灾关系。
· 组件降备或升主完成后需刷新页面。
进入主系统的[系统>应急管理>异地容灾]页面,修改站点配置参数,单击<更新配置>按钮,可以更新容灾系统,如图10-9所示。
使用系统默认的admin用户登录统一数字底盘,进入[系统>应急管理>异地容灾]页面,在容灾关系配置菜单下,可以管理容灾关系、查看各组件的同步状态,如图10-10和图10-11所示。
倒换前请先单击<检查>按钮对组件进行检查,并根据检查结果进行相应处理。
在备站点的异地容灾页面,单击容灾关系配置操作栏中的接管按钮,将备系统切换为主系统。
在主站点的异地容灾页面,单击容灾关系配置操作栏中的降备按钮,将主系统切换为备系统。
当集群内某个控制组件的数据同步状态异常时,可在主用站点的该页面下单击对应控制组件操作区栏的同步按钮进行修复。修复过程中需要确保主备站点用于数据同步的灾备网络正常,否则可能导致修复失败。
· 拆除容灾关系前,请根据实际组网,对其中一个集群和南向业务网络连接做物理隔离,保证该集群到南向业务网络不通,防止出现双主站点,影响南向业务正常运行。
· 容灾关系建立、拆除和主备倒换过程中,对集群节点进行断电、重启和断开网络连接等操作,会有概率造成数据损坏,导致容灾关系建立失败,备集群不可用。此时,使用历史备份文件在备集群后台执行数据恢复操作来修复备集群,待修复完成,备集群可用后,再次尝试建立容灾关系。
· 请勿在增加或删除容灾组件期间执行任何业务操作。
(1) 进入[自动化>分支网络>参数配置>模板管理>Websocket模板]页面,确认将被裁撤站点的Matrix北向业务虚IP是主Server还是备Server。
图10-12 查看Matrix北向业务虚IP类型
如果将被裁撤站点的Matrix北向业务虚IP是主连接,则需要删除设备上的WebSocket主Server地址配置,命令如下。
undo cloud-management server domain
如果将被裁撤站点的Matrix北向业务虚IP是备连接,则需要删除设备上的WebSocket备Server地址配置,命令如下。
undo cloud-management backup-server domain 192.168.30.145 port 19443 //将被裁撤站点的Matrix北向业务虚IP
请根据实际组网情况,确认需要删除的Websocket Server配置。
(2) 对于已上线设备,进入[自动化>分支网络>业务保障>配置下发]页面,选择设备,根据实际组网和环境情况,参考步骤(1),输入待下发的命令,单击<发送>按钮下发。如图10-13所示。检查是否都下发成功,下发失败的设备和不在线的设备需要手动在设备上删除。
图10-13 批量下发Websocket备连接配置
在主系统的[系统>备份恢复]页面,单击<开始备份>按钮,勾选对应组件,单击<备份>按钮,开始备份。如图10-14所示。
在主系统的[系统>应急管理>异地容灾]页面,先删除容灾关系,再删除容灾系统。
单击容灾关系配置操作列的<删除>按钮删除容灾关系。如图10-15所示。
单击站点配置下发的<删除站点>按钮,删除容灾系统。如图10-16所示。
方案必选组件场景:
· 单机/集群部署200规模内:需要在Matrix手动调整kafka limit值为2G,调整websocket limit值为3G。
· 单机部署200~2000规模:需要在Matrix手动调整kafka limit值为6G,调整websocket limit值为11G。
· 集群部署200~2000规模:需要在Matrix手动调整kafka limit值为6G,调整websocket limit值为6G。
若部署其他可选组件以及与其他组件融合部署场景下,还需结合融合部署组件的要求单独评估调整。
(1) 登录Matrix页面。
(2) 单击应用菜单项,进入部署管理页面。
(1) 在部署应用列表,SYSTEM/websocket/websocket列表下找到connection应用。如图11-1所示。
(2) 单击connection应用的详情按钮,查看connection应用详情信息。
(1) 在connection应用详情页面中,单击“websocket-connection1”链接,然后单击<配置>按钮。如图11-2所示。
图11-2 connection应用详情页面
(2) 修改内存限制的值为11Gi,单击<应用>按钮。如图11-3所示。
(3) 若是集群环境,重复(1)(2)操作,修改websocket-connection1,websocket-connection2,websocket-connection3三个容器的应用内存限制。
(1) 登录Matrix页面。
(2) 单击应用菜单项,进入部署管理页面。
(1) 在部署应用列表下,SYSTEM/kernel/kernel列表下找到common应用。如图11-4所示。
(2) 单击common应用的详情按钮,查看common应用详情信息。
(1) 在kafka应用详情页面中,单击“kafka-0”链接,然后单击<配置>按钮。如图11-5所示。
图11-5 kafka应用详情页面
(2) 修改kafka-0的内存限制的值为6Gi,单击<应用>按钮。如图11-6所示。
图11-6 修改kafka-0的内存限制
(3) 若是集群环境,重复(1)(2)操作,修改kafka-0,kafka-1,kafka-2三个容器的应用内存限制。