01-正文
本章节下载: 01-正文 (2.50 MB)
目 录
11.1 节点中存在多个网卡配置IP地址并且网卡UP时,如何增加安全策略?
11.4 园区场景单机融合部署时如何调整集群最大微服务数量限制?
11.8 如何解决在“南北向网络合一”(南向无网络)场景下分析组件的SNMP-Trap采集功能不可用问题?
11.9 如何将数据盘分区的文件系统类型修改为ext4类型?
分析组件聚焦于机器数据的价值挖掘,以大数据技术为基础,通过机器学习、深度学习等手段,从海量数据中分析有价值的信息,为企业网络、业务运维以及商业决策提供参考依据。分析组件通过对设备性能、用户接入、业务流量的实时数据采集和状态感知,通过大数据分析技术和人工智能算法,将网络的运行可视化,主动感知网络的潜在风险并自动预警。
分析组件支持Campus、WAN、DC等多个场景的数据分析。分析组件所分析的数据主要包括:网络设备运行数据、网络业务应用流量数据、用户接入和使用网络的记录数据等。
各场景功能简介:
· Campus场景:园区分析组件以用户体验保障为目的,通过Telemetry采集用户接入和使用网络的指标数据,使用大数据及AI技术分析用户体验健康度及体验问题,并结合网络设备健康度指标数据,关联分析影响用户体验的根因和处理建议。
· WAN场景:WAN分析组件作为广域网智能运维的核心引擎,通过采集状态数据、日志数据、流量数据等多维度网络信息,结合大数据、AI技术对数据进行汇总分析实现智能运维,提供全网健康度测评、应用流分析、容量预测,智能故障诊断等能力,是广域网智能运维的核心引擎。
· DC场景:数据中心分析组件以保障数据中心网络的高可靠、低延时为目的。通过全时全量采集网络设备运行信息,建立起全网的健康度评估体系,支持对数据中心内TCP\UDP的会话分析、应用的可视与分析、芯片级缓存监控和丢包分析。对数据中心网络运维实现了全方位支持与保障。
术语 |
说明 |
SeerCollector采集器 |
如果使用分析组件的TCP/UDP流分析、INT流分析功能,需要部署SeerCollector采集器 |
COLLECTOR采集组件 |
COLLECTOR采集组件为公共采集组件,提供采集服务,包括SNMP、GRPC、NETCONF等协议 |
分析组件基于统一数字底盘部署,支持物理机部署和虚拟机部署,推荐部署在物理服务器上。支持两种部署模式(单机模式和集群模式),相关说明如表2-1所示。
部署模式 |
所需服务器数量(台) |
部署说明 |
单机模式 |
1 |
1台服务器作为Master节点部署统一数字底盘,并将分析组件部署在统一数字底盘上 当网络规模较小且不要求高可靠性的场景才可以采用单机模式 |
集群模式 |
3+N |
3台服务器作为Master节点部署统一数字底盘。 · 当分析组件独立部署时: ¡ 3+N(N≥0)模式:支持分析组件部署在任意指定的3个Master节点+N(N≥0)个Worker节点上 · 当控制组件与分析组件融合部署时: ¡ 3机模式:控制组件和分析组件融合部署在同一套统一数字底盘集群的3个Master节点上 ¡ 3+1模式:统一数字底盘和控制组件部署在3个Master节点上, 分析组件部署在一个Worker节点上 ¡ 3+N(N≥3)模式:统一数字底盘和控制组件部署在3个Master节点上,分析组件部署在N个Worker节点上 |
对于不同的场景和网络规模,分析组件所分析的业务量存在较大的差异。其中,产生大业务量的主要是网络业务应用流量数据。分析组件支持独立部署,同时支持与场景组件融合部署。
硬件配置需求,是在部署基础平台及对应场景组件的环境中,仅根据分析组件所能够承载的业务量评估的结果,如需考虑场景组件所能承载的业务量,请进一步评估硬件资源需求。不同的业务量所需的硬件配置有差异。
· 对于安装部署统一数字底盘的服务器,其CPU架构需为x86-64(Intel64/AMD64)或ARM,系统硬盘为HDD(SAS/SATA)硬盘或SSD硬盘,数据硬盘可采用SSD固态硬盘或机械硬盘(SATA/SAS),磁盘条件允许时建议RAID5。RAID卡不低于1GB写缓存,支持数据掉电保护,并且服务器必须支持安装NingOS 3.1.0及以上版本的操作系统。
· 分析组件不同版本适配的CPU架构型号不同,具体请关注版本配套发布的文件。
· 数据盘总容量一定的情况下,磁盘数量越多读写性能越好,例如:6块2TB的硬盘读写性能优于3块4TB的硬盘。
· 如果使用分析组件的TCP流分析、INT流分析功能,需要部署SeerCollector采集器。请参见“2.2 SeerCollector采集器的服务器配置要求”。
· 数据盘必须使用独立的磁盘。
分析组件支持单机和集群部署,推荐3机集群部署模式。
各场景的硬件配置要求请参考资源计算工具。
支持如下操作系统:
· NingOS V3.1.0操作系统
· 银河麒麟 V10 SP2操作系统
· 银河麒麟 V10 SP3-2403操作系统
集群中所有节点必须安装相同版本的操作系统。
分析组件运行在统一数字底盘上,部署分析组件前需要先安装统一数字底盘。
· 如果使用分析组件的TCP/UDP流分析、INT流分析功能,需要部署SeerCollector采集器。
· SeerCollector采集器在分析组件中的管理页面菜单路径为[分析>分析选项>采集管理>采集器管理>先知采集器]。
· SeerCollector采集器若使用Intel品牌的CPU,请确保其型号为E5-2690 v4及以上(可执行lscpu命令查看具体CPU型号),否则将导致SeerCollector采集器无法正常使用。
SeerCollector采集器需安装在物理服务器上。硬件配置需求如下所示。
表2-2 SeerCollector采集器服务器硬件规格(x86-64(Intel64)架构)
属性 |
配置要求 |
采集器节点 |
· CPU:Intel(R) Xeon(R) 可扩展处理器(推荐使用Platinum或Gold系列),2.0GHz主频及以上,核数不低于20 · 内存:128G及以上 · 系统盘:2*600GB(建议RAID1)及以上,HDD(SAS/SATA)或SSD硬盘 · 网卡(冗余模式):1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond ¡ 采集网口x86服务器推荐Intel 82599芯片的网卡,请提前规划好哪张网卡需要用于采集,记录好网卡的信息(名字、MAC),规划并设置好IP地址等操作,配置下发后,采集网卡被DPDK接管,通过Linux内核命令将看不到使用的网卡 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡 ¡ 禁止对管理网口进行DPDK绑定 |
· SeerCollector采集器需要确保采集网卡对应的numa节点已被分配内存,否则无法识别网卡,将导致SeerCollector运行失败。具体步骤请参考11.5 如何查看numa节点是否被分配内存?。若未分配内存,需要尝试调整内存条位置,确保对应numa节点有被分配内存。
· SeerCollector采集器若选用海光服务器,不能手动关闭超线程。如何查看超线程功能是否开启请参考11.6 如何查看是否开启超线程?。
· SeerCollector采集器若选用海光服务器,首次安装完操作系统,需要开启硬件虚拟化功能,否则dpdk网卡不能正常收包,操作步骤请参考11.7 如何开启硬件虚拟化功能?。
· SeerCollector采集器若使用飞腾服务器,需要确保前16核对应的numa节点被分配内存(例如一个numa节点有8个核,node1为第0到第7核,node2为第8到第15核,则需要保证node1和node2被分配内存),查看是否被分配内存请参考11.5 如何查看numa节点是否被分配内存?。
表2-3 SeerCollector采集器服务器硬件规格(x86-64 海光服务器)
属性 |
配置要求 |
采集器节点 |
· CPU:32核(总物理核),2.2GHz主频及以上,推荐:2 * Hygon C86 7265 24核2.2GHz主频 · 内存:总容量不少于128GB,并配备至少8条内存条(例如128GB容量则需要8条16GB内存) · 系统盘:2*600GB,磁盘做RAID1,HDD(SAS/SATA)或SSD硬盘 · 网卡:1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond模式 ¡ 采集网口x86服务器推荐Intel 82599芯片的网卡,请提前规划好哪张网卡需要用于采集,记录好网卡的信息(名字、MAC),规划并设置好IP地址等操作,配置下发后,网卡被DPDK接管,通过Linux内核命令将看不到使用的网卡。 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡。 ¡ 禁止对管理网口进行DPDK绑定。 |
表2-4 SeerCollector采集器服务器硬件规格(ARM 鲲鹏服务器)
属性 |
配置要求 |
采集器节点 |
· CPU:64核(总物理核),2.6GHz主频及以上;推荐:2 * Kunpeng 920 5232 32核2.6GHz主频 · 内存:128GB及以上 · 系统盘:2*600GB,磁盘做RAID1,HDD(SAS/SATA)或SSD硬盘 · 网卡:1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond模式 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡。 ¡ 禁止对管理网口进行DPDK绑定。 |
表2-5 SeerCollector采集器服务器硬件规格(ARM飞腾服务器)
属性 |
配置要求 |
采集器节点 |
· CPU:128核(总物理核),2.1GHz主频及以上;推荐:2 * 飞腾S2500 64核2.1GHz主频 · 内存:128GB及以上 · 系统盘:2*600GB,磁盘做RAID1,HDD(SAS/SATA)或SSD硬盘 · 网卡:1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond模式 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡。 ¡ 禁止对管理网口进行DPDK绑定。 |
· 分析组件不同版本适配的CPU架构型号不同,具体请关注版本配套发布的文件。
· 采集服务器上需要两个网口:一个网口负责采集业务,用于接收网络设备发送过来的镜像报文,该网口必须支持DPDK,且需要手动配置IP地址,以便在后续分析组件中增加采集节点时使用;另一个负责管理业务,用于与分析组件数据交互。
· 若选用麒麟系统,网卡bond必须配置IP地址,否则bond的网卡不可用。
表2-6 SeerCollector采集网卡支持列表(x86-64(Intel64)架构)
厂商 |
芯片 |
型号 |
型号系列 |
支持版本 |
Intel |
JL82599 |
H3C UIS CNA 1322 FB2-RS3NXP2D-2端口万兆光接口网卡(SFP+) |
CNA-10GE-2P-560F-B2 |
所有版本 |
JL82599 |
H3C UIS CNA 1322 FB2-RS3NXP2DBY-2端口万兆光接口网卡(SFP+) |
CNA-10GE-2P-560F-B2 |
所有版本 |
|
X550 |
H3C UNIC CNA 560T B2-RS33NXT2A-2端口万兆电接口网卡-1*2 |
|
所有版本 |
|
X540 |
UN-NIC-X540-T2-T-10Gb-2P(电接口网卡) |
|
所有版本 |
|
X520 |
UN-NIC-X520DA2-F-B-10Gb-2P |
|
所有版本 |
|
Mellanox |
MT27710 Family [ConnectX-4 Lx] |
NIC-ETH540F-LP-2P |
Mellanox Technologies MT27710 Family |
所有版本 |
MT27712A0-FDCF-AE[ConnectX-4Lx] |
NIC-620F-B2-25Gb-2P |
|
所有版本 |
|
Broadcom |
BCM57414 |
NetXtreme-E 10Gb/25Gb RDMA Ethernet Controller(rev 01) |
|
所有版本 |
磁盘RAID规划 |
分区名称 |
挂载点 |
最小容量 |
备注 |
2*600GB,RAID1 |
/dev/sda1 |
/boot/efi |
200MB |
EFI System Partition类型,仅UEFI模式需要配置该分区 |
/dev/sda2 |
/boot |
1024MB |
- |
|
/dev/sda3 |
/ |
590GB |
|
|
/dev/sda4 |
swap |
4GB |
swap类型 |
· SeerCollector采集器不需要数据盘存储。
· 当系统磁盘大于1.5T时,SeerCollector采集器系统盘可自动分区规划,否则可参考表2-7对系统盘手动分区规划。
表2-8 SeerCollector支持系统及CPU参考表
CPU |
操作系统 |
内核版本 |
备注 |
海光(x86) |
麒麟操作系统V10SP2 |
4.19.90-24.4.v2101.ky10.x86_64 |
支持所有版本 |
NingOS V3.1.0 |
5.10.0-136.12.0.86.4.nos1.x86_64 |
支持E7101及之后版本 |
|
Intel(X86) |
麒麟操作系统V10 SP2 |
4.19.90-24.4.v2101.ky10.x86_64 |
支持所有版本 |
麒麟操作系统V10 SP3-2403 |
4.19.90-89.18.v2401.ky10.x86_64 |
支持E7202及之后版本 |
|
NingOS V3.1.0 |
5.10.0-136.12.0.86.4.nos1.x86_64 |
支持E7101及之后版本 |
|
鲲鹏(ARM) |
麒麟操作系统V10 SP2 |
4.19.90-24.4.v2101.ky10.aarch64 |
支持所有版本 |
飞腾(ARM) |
麒麟操作系统V10 SP2 |
4.19.90-24.4.v2101.ky10.aarch64 |
支持所有版本 |
查看内核版本的方法如下:使用压缩软件(如WinRAR)打开“.iso”文件后,进入Packages目录,找到名称为kernel-version.rpm的文件,其中version代表内核版本。例如,文件路径Packages\kernel-3.10.0-957.27.2.el7.x86_64.rpm对应的内核版本为3.10.0-957.27.2.el7.x86_64。
推荐使用表2-8的操作系统。
· 若SeerCollector采集器需要重装或更新操作系统,必须先卸载SeerCollector采集器。
· 在安装操作系统时,请配置采集网口和管理网口的IP地址。
请根据1. 硬件配置需求,安装部署2. 操作系统需求中对应的操作系统,完成对SeerCollector采集器操作系统的安装。配置采集器时,将自动安装采集器软件包。
· 关闭SeerCollector采集器的防火墙并关闭防火墙开机自动启动功能。
a. 执行systemctl stop firewalld命令关闭防火墙。
b. 执行systemctl disable firewalld命令关闭防火墙自启动。
c. 执行systemctl status firewalld命令查看防火墙状态。当状态为Active: inactive (dead)时,表示防火墙已关闭。
[root@localhost ~]# systemctl status firewalld
firewalld.service - firewalld - dynamic firewall daemon
Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)
Active: inactive (dead)
Docs: man:firewalld(1)
· 为了防止与业务路由冲突,需在操作系统的/etc/sysconfig/network-scripts/路径下找到以ifcfg为前缀的采集网卡配置文件,修改DEFROUTE参数值为no,进行保存即可。
用户不需要安装客户端软件,使用浏览器即可访问分析组件。推荐使用的浏览器为Google Chrome 96及以上版本。
安装环境请参考表2-9中所示的各个检测项目,确保安装统一数字底盘的条件已经具备。
检测项 |
检测标准 |
|
服务器 |
硬件检查 |
· 请检查硬件是否符合要求(包括CPU、内存、硬盘、网卡等) · 请分别检查分析组件和SeerCollector采集器是否支持NingOS 3.1.0及以上版本的操作系统 |
软件检查 |
请确保服务器已配置磁盘阵列 |
|
客户端 |
请确保浏览器版本符合要求 |
|
服务器和操作系统兼容性 |
请参见以下链接,查看H3C服务器和操作系统的兼容性列表:https://iconfig-chl.h3c.com/iconfig/OSIndex |
NingOS操作系统的相关通用配置可以参考NingOS相关文档。
上传应用安装包之后,请参见如下命令对软件包执行MD5验证,确保软件包的完整性和正确性。
(1) 查看已上传的安装包。
[root@node1~]# cd /opt/matrix/app/install/packages/
[root@node1~]# ls
BMP_Common_E7201_x86.zip BMP_Connect_E7201_x86.zip
…略…
(2) 查看安装包的MD5值,以UDTP_Base_E7201_x86.zip为例。
[root@node1~]# md5sum UDTP_Base_E7201_x86.zip
652845e0b92bbdff675c7598430687e2 UDTP_Base_E7201_x86.zip
(3) 将上述步骤中获取到的MD5值与发布的软件版本文件MD5值进行比对,若一致,则软件包正确。
· 解决方案组网推荐采用南向单协议栈。
· 网络需要在Analyzer-Collector公共采集组件安装时进行配置。
· 在规划南向网络的IP地址池时,IP网段区间不能包含北向业务虚IP地址,否则可能造成IP地址冲突。
· 只有在使用WAN仿真组件应用中的设备仿真功能时,才需要配置WAN仿真分析IP地址,具体配置方式请参考2.6.2 分析组件网络规划。
· 北向网络:即统一数字底盘中设置的北向业务虚IP,是集群对外提供服务的网络。
· 南向网络:COLLECTOR公共采集组件用于接收来自设备端的采集数据所使用的网络。需确保南向网络和待采集设备之间可达。目前南向支持三种网络方案,请根据实际组网选择:
¡ 南北向网络合一(南向无网络):分析组件不配置单独的南向网络。上云环境,仅支持此种网络。
¡ 南向单协议栈:创建一个网络并指定为南向网络,采集网络使用IPv4或IPv6。
¡ 南向双协议栈:创建两个南向网络,分别采集IPv4和IPv6的设备。
· 仿真网络:WAN场景部署仿真组件和DTN_MANAGER组件时用于管理仿真虚拟设备和DTN服务器所使用的网络。
· 北向网络是给用户通过web页面和后端访问用的,同时也作为集群节点之间通信的网络,对带宽要求较高,要求北向网络能达到万兆带宽。
· 南向是给业务数据上报用的,是业务网络,一般不对外暴露访问,流量大,有带宽要求;采用南向主要是实现业务数据与管理网络的隔离,不相互干扰,如果采用不同网卡和不同网段,就实现了物理和网段双重隔离;
· 如果采用同一网卡不同网段,那么只实现网段隔离;如果采用相同网段且相同网卡(南北向合一),那么就完全没有隔离;根据实际业务需求进行网络模式选择。一般生产环境,管理网络和业务网络都不是同网段,管理网络都是通过堡垒机监管业务情况,所以一般都是有南向网络的,且与北向不同网段。
南北向网卡和网段配置复用说明:
· 南向网络的网卡和北向网络的网卡共用一张。
· 南向网络的网段和北向网络的网段相同。
· 在网卡和网段资源充足的情况下,我们推荐使用不同网卡和不同网段,即使用南向单协议,因为可以将南北向完全隔离,互不干扰。有双栈需求时可以选择南向双协议栈部署。
部署分析组件时,各场景网络规划:
· DC场景需要部署1个SeerCollector采集器节点,需提前规划SeerCollector采集器相关的IP地址。
· Campus场景,默认无需部署SeerCollector采集器节点,无需规划SeerCollector采集器IP地址。在需要DC场景的TCP流分析组件时,需规划采集器节点及IP地址。
· WAN场景无需部署SeerCollector采集器节点,无需规划SeerCollector采集器IP地址。
· WAN场景部署仿真组件应用且使用设备仿真时,需要规划仿真网络IP地址。
南北向网络合一(南向无网络),指分析组件数据采集共用统一数字底盘的网络,不单独创建附加网络。
单机模式下有一个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-10所示。
表2-10 分析组件网络规划-单机模式
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
1个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
||
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
集群模式下有三个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-11所示。
表2-11 分析组件网络规划-集群模式
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
3个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
南向单协议栈组网方案中,数据采集使用单独的网络,可使用IPv4或IPv6协议。
单机模式下有一个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-12所示。
表2-12 分析组件网络规划-单机模式南向单协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
1个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
||
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IP地址 |
4个(IPv4)或4个(IPv6) |
南向采集IP地址为容器附加网络地址,主动/被动采集网络分别需要2个IP地址,一个节点容器IP和一个集群虚IP地址,共4个IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
集群模式下有三个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-13所示。
表2-13 分析组件网络规划-集群模式南向单协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
3个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IP地址 |
8个(IPv4)或8个(IPv6) |
南向采集IP地址为容器附加网络地址,主动/被动采集分别需要4个IP地址,三个节点容器IP地址和一个集群虚IP地址,共8个IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
如果有SeerCollector采集器,“南向采集IP地址”和“SeerCollector采集器数据采集IP地址”两个地址需要使用相同的IP协议版本。
南向双协议组网方案中,数据采集使用单独的网络,并且需要同时配置IPv4和IPv6的地址。
单机模式下有一个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-14所示。
表2-14 分析组件网络规划-单机模式南向双协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
1个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IP地址IPv4 |
4个(IPv4) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,主动和被动采集网络分别需要2个IP地址,一个容器IP地址和一个集群虚IP地址,共需要4个IPv4地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
网段四 |
南向采集IP地址IPv6 |
4个(IPv6) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,主动和被动采集网络分别需要2个IP地址,一个容器IP地址和一个集群虚IP地址,共需要4个IPv6地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
集群模式下有三个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-15所示。
表2-15 分析组件网络规划-集群模式南向双协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
3个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IPv4地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IPv4地址 |
8个(IPv4) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,分别需要三个节点容器IP地址和一个集群虚IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
网段四 |
南向采集IPv6地址 |
8个(IPv6) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,分别需要三个节点容器IP地址和一个集群虚IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
单机模式下有一个仿真组件节点和一个DTN_MANAGER组件节点,组件的网络规划如下表所示。
表2-16 分析组件网络规划-单机模式仿真网络单协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
WAN仿真分析IP地址 |
3个(IPv4) |
一个用于DTN_MANAGER组件与DTN服务器互通 另外两个用于设备仿真网络连接 |
WAN仿真分析网卡,使用设备仿真功能时必须使用独立DPDK网卡 |
集群环境下,仿真组件和DTN_Manager只需要绑定1个节点,所需IP个数与单机模式一致。
分析组件部署流程汇总如表3-1所示。
步骤 |
具体操作 |
说明 |
服务器准备 |
准备1台或3台服务器用于安装统一数字底盘 |
必选 服务器配置需求请参见2.1 分析组件服务器配置需求 |
安装统一数字底盘 |
在服务器上安装统一数字底盘Matrix集群 |
必选 |
部署统一数字底盘集群和应用,部署顺序: 1. UDTP_Base 2. BMP_Common 3. BMP_Connect(可选) 4. BMP_Extension(可选) 5. BMP_Syslog(可选) |
必选 |
|
安装Report |
可选 如需使用报表功能,需要安装此组件。 |
|
安装iWO |
可选 如需使用Campus无线运维功能,需要安装此组件。 |
|
配置准备 |
可选 |
|
部署分析组件 |
必选 |
· 融合场景指在同一个统一数字底盘的集群环境中,既安装控制组件产品,又安装分析组件产品,请务必先安装控制组件,再安装分析组件。
· 园区融合场景下,一般需要同时部署统一数字底盘+vDHCP+SE+EIA+WSM+SA,由于组件众多,在单机部署时会出现微服务数量超过集群默认最大限制,此时需要调整集群对微服务数量的限制,具体调整说明请参见11.4 园区场景单机融合部署时如何调整集群最大微服务数量限制?。
使用不同的操作系统安装过程可能会存在差异,详情请参见《H3C统一数字底盘部署指导》,分析组件适配的统一数字底盘版本请参考对应的版本说明书。
需要注意的是,如需在统一数字底盘上运行分析组件,需要参照本章节的内容进行磁盘分区,并部署分析组件所需的所有应用安装包。
若需重装某个Master节点的操作系统,请在完成该节点的重装和重建后,在其他任意一个无需重装操作系统的Master节点上执行以下脚本:
进入/opt/matrix/app/deploy-tool/custom_file/APP-PUBLIC-COLLECTOR-E7102-时间戳/collection-exec-pre/fault_migration/,执行 sh -x faultMigration.sh $IP。
其中$IP为新建节点的管理IP,否则itoa-collect-multi容器将无限重启。
安装时请注意以下事项:
· 设置系统的日期和时间时,请根据自己的实际情况选择所需要的时区。
· 选择时区时,不允许选择“北京”,否则将会导致Base组件部署失败。
· 对于使用内置NTP服务器的场景,在部署集群之前,需确保所有节点的系统时间和当前时间保持一致。对于使用外置NTP服务器作为时钟同步源的场景,则无需修改节点的系统时间。
· 若NTP服务器不与南向地址相通,可以先不增加NTP服务器。待集群创建完成后,在配置网卡网络时,通过修改集群参数再增加。
· 集群部署完成后,请勿修改系统时间,否则可能导致集群异常。
· 主机名只能包含小写字母、数字、连字符和小数点,且不能以连字符、小数点起始或结束。
· 建立Matrix集群时,必须保证集群内各个节点的主机名互不相同,且符合主机名的命名规则,否则将会导致集群建立失败。
· Matrix集群部署完成后,请不要再对操作系统的主机名进行修改。
· 当网络列表显示多个网络时,请勿选择带<网线已拔出>标识的网卡。
· 当安装环境存在两张及以上数量网卡时,北向业务虚IP使用的网段必须和ifconfig命令查看到的第一块物理网卡的网段保持一致,否则会导致集群部署失败或Pod无法启动。
· 在网络和主机名配置页面可配置网卡,请确保在创建集群之前,完成网卡绑定的配置。
· 配置IPv4、IPv6地址时必须指定网关,否则在创建集群时可能出现问题。
· 操作系统安装完成后,建议不要使用ifconfig命令进行关闭、启动网卡的操作,否则可能导致环境异常。
· Matrix单独使用一个网口,不允许在此网口上配置子接口及子IP。
· Matrix节点其它网口的IP地址,不能和建立集群使用的IP处于同一网段。
· 在Matrix上进行操作时,请勿在统一数字底盘上进行如下操作:
¡ 上传、删除组件安装包。
¡ 部署、升级、扩容组件。
¡ 增加、修改、删除网络。
· 若选用NingOS V3.1.0部署,南向网络的网卡如果采用bond模式时,需要按如下方式修改网卡bond配置,否则影响采集组件使用。
a. 使用有管理员权限登录服务器后台,将配置文件/etc/sysconfig/network-scripts/ifcfg-xxx(bond网卡名称)中的IPV6_AUTOCONF配置为no:
图4-1 配置修改
b. 修改完成后,在后台执行命令nmcli c reload && nmcli c up xxx(bond网卡名称)。
· 修改节点时间的注意事项如下:
¡ 修改所有导入至SeerAnalyzer的设备的时区,需要与SeerAnalyzer服务器的时区保持一致。
¡ 修改SeerCollector采集器的时区,需要与SeerAnalyzer服务器的时区保持一致。
· 如需使用HTTPS协议,请在应用和组件安装完成后,登录统一数字底盘,点击[系统>系统配置>安全配置]菜单项,进入安全配置页面,启用HTTPS协议。
· 在部署SeerAnalyzer和SeerCollector前,请在各节点执行cat /proc/sys/vm/nr_hugepages命令检查大页是否开启,如果返回结果不是0,请记录该值,并执行echo 0 > /proc/sys/vm/nr_hugepages命令临时关闭大页。待部署SeerAnalyzer和SeerCollector完成后,再将echo 0 > /proc/sys/vm/nr_hugepages命令中的数字0改为记录的值,并在各节点执行,以恢复大页配置。
根据不同的业务量和不同的服务器配置需求进行了不同的磁盘RAID和分区规划。实际分区过程中,分区名称不需要与表格中的分区名称完全一致。
· 一般情况下,磁盘部分分区有特殊要求,请根据备注进行配置。
· 分析组件部署完成以后,不支持动态扩展硬盘,需要提前准备好硬盘,再安装部署。
· 分析组件数据盘必须要规划2个分区在 “/sa_data/mpp_data”、“/sa_data/kafka_data”这2个挂载点上,同时文件系统类型必须配置为ext4类型,否则会部署失败。若按照4.2.2 数据盘RAID和分区规划推荐的分区规划进行数据盘分区但未修改文件系统类型的情况下,可参考11.9 如何将数据盘分区的文件系统类型修改为ext4类型?修改文件系统类型。
· 数据盘必须使用独立的磁盘。
/opt/matrix/app/data/base-service/backupRecovery:业务备份数据存放使用,该分区的容量和各组件的业务备份数据大小有关,需要各组件确定占用的磁盘容量大小,在此基础上扩缩容。
系统盘主要用于存储操作系统和统一数字底盘的相关数据。统一数字底盘对系统盘大小有要求,需要配置RAID,RAID模式可选RAID1、RAID5、RAID10。在磁盘条件满足的情况下,分区规划请参见下表。
表4-1 磁盘RAID和分区规划(Campus(不安装无线运维)/DC/WAN场景)
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
备注 |
1400GB |
/dev/sda1 |
/boot/efi |
200MB |
EFI System Partition类型,仅UEFI模式需要配置该分区 |
/dev/sda2 |
/boot |
1024MB |
- |
|
/dev/sda3 |
/ |
250GB |
磁盘空间充足时,可适当扩容,业务数据不建议放在根目录 |
|
/dev/sda4 |
/var/lib/docker |
210GB |
磁盘空间充足时,可适当扩容 |
|
/dev/sda6 |
swap |
4GB |
swap类型 |
|
/dev/sda7 |
/var/lib/ssdata |
430GB |
磁盘空间充足时,可适当扩容 |
|
/dev/sda8 |
/var/lib/ssdata/logcenter |
280GB |
用于存放日志数据 磁盘空间充足时,可适当扩容 |
|
/dev/sda9 |
/opt/matrix/app/data/base-service/backupRecovery |
100GB |
(可选)业务备份数据存放分区 不创建此分区时,业务备份数据存放于根分区下,即要在当前根分区大小的基础上增加该分区存储容量 由于各业务场景需求不同,需要根据实际情况划分大小 |
|
/dev/sda10 |
/var/lib/ssdata/middleware/seaio |
80GB |
--- |
|
50GB |
/dev/sdb |
/var/lib/etcd |
50GB |
ETCD分区可与其他分区共用物理硬盘,从性能角度考虑,推荐ETCD分区占用独立的物理硬盘 |
园区无线运维组件需要占用系统盘存储空间,故园区场景系统盘空间在上表基础上有所增加。其中AP数量5000及以下,/var/lib/ssdata需要增加500GB容量,AP数量5000以上,/var/lib/ssdata需要增加1TB容量,其它分区具体见下表。整体上,AP数量5000及以下,系统盘需2*2.08TB(RAID1),AP数量5000以上,系统盘需2*2.58TB(RAID1)。
表4-2 磁盘RAID和分区规划(Campus场景+无线运维)
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
备注 |
2080GB或2580GB |
/dev/sda1 |
/boot/efi |
200MB |
EFI System Partition类型,仅UEFI模式需要配置该分区 |
/dev/sda2 |
/boot |
1024MB |
- |
|
/dev/sda3 |
/ |
260GB |
磁盘空间充足时,可适当扩容,业务数据不建议放在根目录 |
|
/dev/sda4 |
/var/lib/docker |
310GB |
磁盘空间充足时,可适当扩容 |
|
/dev/sda6 |
swap |
4GB |
swap类型 |
|
/dev/sda7 |
/var/lib/ssdata |
930GB或1430GB |
磁盘空间充足时,可适当扩容 注:5000AP及以下推荐930GB;5000AP以上推荐1430GB |
|
/dev/sda8 |
/var/lib/ssdata/logcenter |
330GB |
用于存放日志数据 磁盘空间充足时,可适当扩容 |
|
/dev/sda9 |
/opt/matrix/app/data/base-service/backupRecovery |
120GB |
(可选)业务备份数据存放分区 不创建此分区时,业务备份数据存放于根分区下,即要在当前根分区大小的基础上增加该分区存储容量 由于各业务场景需求不同,需要根据实际情况划分大小 |
|
/dev/sda10 |
/var/lib/ssdata/middleware/seaio |
80GB |
--- |
|
50GB |
/dev/sdb |
/var/lib/etcd |
50GB |
ETCD分区可与其他分区共用物理硬盘,从性能角度考虑,推荐ETCD分区占用独立的物理硬盘 |
数据盘主要用于存储分析组件的业务数据和Kafka数据。不同网络规模下,业务数据量不同,对磁盘数量及容量的配置要求不同。数据盘不多于2块时,做RAID0(风险较大,不推荐);数据盘3块及以上时,可以做RAID5,可以满足下表容量要求的情况下,建议做RAID5。
现场实施环境不建议数据盘做RAID0,数据安全风险很大。
表4-3 Campus场景数据盘分区规划1
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
2TB |
/dev/sdc1 |
/sa_data/mpp_data |
950GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
450GB |
ext4类型 |
表4-4 Campus场景数据盘分区规划2
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
3TB |
/dev/sdc1 |
/sa_data/mpp_data |
1550GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
750GB |
ext4类型 |
表4-5 Campus场景数据盘分区规划3
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
5TB |
/dev/sdc1 |
/sa_data/mpp_data |
2800GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
1300GB |
ext4类型 |
表4-6 Campus场景数据盘分区规划4
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
8TB |
/dev/sdc1 |
/sa_data/mpp_data |
4600GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
2200GB |
ext4类型 |
表4-7 DC场景数据盘分区规划1
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
8TB |
/dev/sdc1 |
/sa_data/mpp_data |
4600GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
2200GB |
ext4类型 |
表4-8 DC场景数据盘分区规划2
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
15TB |
/dev/sdc1 |
/sa_data/mpp_data |
9000GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
3400GB |
ext4类型 |
表4-9 DC场景数据盘分区规划3
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
24TB |
/dev/sdc1 |
/sa_data/mpp_data |
14200GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
7000GB |
ext4类型 |
表4-10 WAN场景数据盘分区规划1
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
2TB |
/dev/sdc1 |
/sa_data/mpp_data |
950GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
450GB |
ext4类型 |
表4-11 WAN场景数据盘分区规划2
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
4TB |
/dev/sdc1 |
/sa_data/mpp_data |
2200GB |
ext4类型 |
/dev/sdc2 |
/sa_data/kafka_data |
1000GB |
ext4类型 |
部署分析组件所需的2个数据盘分区随操作系统部署时进行创建,其具体创建过程请参考《H3C统一数字底盘部署指导》中的安装操作系统章节。如果在部署操作系统时未创建对应的数据盘分区,可在底盘部署完成之后进行手动创建。
根据4.2.2 数据盘RAID和分区规划规划的分区大小,在每个要部署分析组件的节点上确认数据盘剩余空间大小是否满足要求。
(1) 确认各节点磁盘剩余空间满足要求以后,通过fdisk命令,创建磁盘分区。
如下图所示,以在sdb磁盘上创建一个400GB空间的分区为例进行说明。
图4-2 创建磁盘分区
若出现“重新读取分区表失败”的提示,使用reboot命令重启节点即可。
如下图所示,在sdb磁盘中创建了一个400GB的空闲磁盘分区/dev/sdb1。
图4-3 查看当前磁盘分区信息
(2) 当使用fdisk命令发生如图4-4所示的报错,需要使用如图4-5所示的命令对数据盘进行处理。
图4-4 fdisk命令发生报错
(3) 按照上述操作,在需要部署分析组件的每个节点上创建2个分区,分区大小参考4.2.2 数据盘RAID和分区规划。
(1) 使用指令mkfs.ext4 /dev/sdb1格式化分区(非ext4的数据盘分区都要执行,上一节创建的分区,默认格式为xfs)。
(2) 使用指令获取新的UUID,过滤条件为对应的磁盘分区,用‘|’隔开。(这里以创建的2个分区分别为sdb1,sdb2为例)。
[root@sa1 ~]# ll /dev/disk/by-uuid | grep -E 'sdb1|sdb2'
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 -> ../../sdb1
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 cac87013-f014-40df-9aca-af76888b1823 -> ../../sdb2
(3) 使用vim /etc/fstab命令替换新的UUID以及修改分区格式类型为ext4。
(4) 查看修改后的文件。
[root@ sa1 ~]# cat /etc/fstab
#
# /etc/fstab
# Created by anaconda on Wed Dec 7 15:44:15 2022
#
# Accessible filesystems, by reference, are maintained under '/dev/disk‘
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=519f9af7-12ce-4567-b62c-2315cad14f56 / xfs defaults 0 0
UUID=83628a24-94f5-4937-b016-64d0f72bd98d /boot xfs defaults 0 0
UUID=3B96-1B3A /boot/efi vfat defaults,uid=0,gid=0,umask=0077,shortname=winnt 0 0
UUID=89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 /sa_data/kafka_data ext4 defaults 0 0
UUID=cac87013-f014-40df-9aca-af76888b1823 /sa_data/mpp_data ext4 defaults 0 0
UUID=51987141-f160-4886-ad51-bc788ec2176c /var/lib/docker xfs defaults 0 0
UUID=4e91a1b8-4890-4a41-be00-098ded6b8102 /var/lib/etcd xfs defaults 0 0
UUID=2554963b-03e7-4be4-b214-7350f2eb3df9 /var/lib/ssdata xfs defaults 0 0
#UUID=a22041b8-7c7c-4730-bc1f-634306145e36 swap swap defaults 0 0
(5) 执行mount -a进行挂载。
出现下报错为正常现象:
mount: 挂载点 /sa_data/kafka_data 不存在
mount: 挂载点 /sa_data/mpp_data 不存在
(6) 创建不存在的目录。
[root@ sa1 ~]# mkdir -p /sa_data/kafka_data
[root@ sa1 ~]# mkdir -p /sa_data/mpp_data
(7) 再次执行mount -a进行挂载即可完成文件系统类型的修改。
(8) 在每一个部署分析组件的节点上执行上述操作。
部署统一数字底盘时,请上传如表4-12所示的应用安装包,具体安装步骤请参见《H3C统一数字底盘部署指导》。
必选应用包必须在部署统一数字底盘时完成部署。部署步骤请参考《H3C统一数字底盘部署指导》中的“部署统一数字底盘应用安装包”章节。
如需部署可选应用包,可选择在部署完分析组件后在Matrix页面部署可选包,也可在部署分析组件前在Matrix页面部署可选包。需要注意的是,请确保可选应用包的版本与必选应用包的版本相同,否则可能导致部署失败。部署步骤请参考《H3C统一数字底盘部署指导》中的“部署统一数字底盘应用安装包”章节。
安装包的名称格式如下表所示,其中version为版本号,platform为CPU架构类型。
安装包名称 |
功能说明 |
说明 |
依赖关系 |
UDTP_Base_version_platform.zip |
基础服务组件:提供融合部署、用户管理、权限管理、资源管理、租户管理、菜单管理、日志中心、备份恢复和健康检查等基础功能。 |
必选 |
- |
BMP_Common_version_platform.zip |
通用服务组件:提供大屏管理、告警、告警聚合和告警订阅等功能。 |
必选 |
- |
BMP_Connect_version_platform.zip |
连接服务组件:提供上下级站点管理、WebSocket通道管理和NETCONF通道管理功能。 |
可选 |
- |
BMP_Extension_version_platform.zip |
扩展服务组件:提供异地容灾、快照回滚、证书服务、自监控、智能算法库、单点登录和密码平台等功能 |
可选 |
Common |
BMP_Syslog_version_platform.zip |
Syslog服务组件:提供Syslog报文的收发、Syslog浏览和聚合、Syslog生成告警等功能。 |
可选 |
Common |
统一数字底盘不在分析组件发布的版本中,请自行下载。
如需使用报表功能需要安装此组件。如下以安装E7201版本的Report组件为例进行介绍。
(1) 下载并解压Report版本压缩包,进入/install/version/目录,可以看到组件压缩包。
(2) 登录Matrix页面,单击“部署”页签,在弹出的菜单中选择“融合部署”,进入部署管理页面。
(3) 单击<安装包管理>按钮,单击<上传>按钮,上传U-Center_REPORT_version_x86.zip。其中,version为版本号,部分版本压缩包可能不携带版本号。
(4) 单击<返回>按钮,返回融合部署页面后,单击<安装>按钮,进入应用选择页面,勾选QuickReport(若未安装依赖组件,系统会自动勾选其依赖组件),单击<下一步>按钮。
(5) 在安装包选择页面,选择待安装的Report安装包,单击<下一步>按钮
(6) 在资源配置页面,完成资源配置后,点击<下一步>按钮。
(7) 在参数配置页面无需进行参数配置,单击<部署>按钮。
(8) 在弹出窗口中进行参数确认,无问题则单击<确定>按钮,开始部署。
iWO组件应用包不包含在分析组件的发布包中。请参考《H3C AD-Campus管理组件 安装部署指导(iWSM、iNSM、iWO)》以获取并部署该组件。
建议不要使用ifconfig命令进行关闭、启动网卡的操作,可能导致环境异常。
若有使用多块网卡的需求,需在服务器上启用网卡。启用网卡的配置步骤如下:
(1) 远程登录统一数字底盘所在服务器,在服务器上修改网卡配置文件。此处以修改网卡ethA09-2的网卡配置文件为例。
(2) 使用以下命令打开并编辑网卡文件。
[root@matrix01 /]# vi /etc/sysconfig/network-scripts/ifcfg-ethA09-2
(3) 将网卡配置文件中的BOOTPROTO和ONBOOT修改为如下图所示。BOOTPROTO配置为none表示不指定网卡的启动协议,ONBOOT配置为yes表示开机自动启用网卡连接。
图5-1 编辑网卡文件
(4) 新增网卡配置:NOZEROCONF=yes。
图5-2 编辑网卡文件
(5) 使用以下命令ifdown和ifup命令重启网卡。
[root@matrix01 /]# ifdown ethA09-2
[root@matrix01 /]# ifup ethA09-2
(6) 使用ifconfig命令查看网络信息。若网卡状态为UP则表示网卡启用成功。
部分分析组件版本发布x86版本或ARM版本中的一种安装包,具体请以版本发布文件为准。
安装包的名称格式如下表所示,其中version为版本号,platform为CPU架构类型。
表5-1 组件应用包列表
产品名称 |
安装包名称 |
功能说明 |
分析组件 |
Analyzer-Platform-verison_platform.zip |
基础平台组件应用包 |
Analyzer-Telemetry-verison_platform.zip |
指标分析组件应用包 |
|
Analyzer-AI-verison_platform.zip |
AI智能预测组件应用包 |
|
Analyzer-Diagnosis-verison_platform.zip |
诊断分析组件应用包 |
|
Analyzer-SLA-verison_platform.zip |
服务质量分析组件应用包 |
|
Analyzer-TCP-verison_platform.zip |
TCP流分析组件应用包 |
|
Analyzer-WAN-verison_platform.zip |
WAN应用分析组件应用包 |
|
DTN_MANAGER-verison.zip |
DTN主机管理组件应用包 |
|
Analyzer-Simulation-verison_platform.zip |
WAN网络仿真组件应用包 |
|
Analyzer-User-verison_platform.zip |
用户分析组件应用包 |
|
Analyzer-AV-verison_platform.zip |
音视频分析组件应用包 |
|
Analyzer-Collector-verison_platform.zip |
Analyzer-Collector安装包需要在部署分析组件时安装 |
分析组件:
分析组件发布版本包:SEERANALYZER-verison.zip,verison为版本号。解压之后才能看到具体的安装包。
采集组件说明:
· COLLECTOR采集器: COLLECTOR采集器为公共采集组件。
· SeerCollector采集器: SeerCollector采集器在使用分析组件的TCP流分析、INT流分析功能时需要部署。
· 在部署分析组件时,使用不同版本的统一数字底盘,配置过程会略有差异,具体配置操作可参考对应版本的统一数字底盘部署指导手册中“部署组件”章节。
· 分析组件可按需部署对应场景,在分析组件部署完成后,不可追加部署其他场景,需要卸载分析组件后重新部署。
· 分析组件部署后不支持修改主机名,详情可参见H3C 统一数字底盘部署指导。
· 在部署分析组件时修改Matrix节点和集群IP地址,需要提前在[分析选项>任务管理]页面下将所有解析任务停用再修改,否则容易引发修改失败。
· 如何部署DTN主机,以及在分析组件上构建仿真网络请参见《H3C SeerAnalyzer-WAN仿真网络操作指导》。
· 仅支持统一数字底盘E7201及之后版本。
登录Matrix页面,单击“部署”页签,在左侧导航树中选择“融合部署”菜单项,未部署任何分析组件时,如下图所示。
(1) 单击<安装包管理>按钮,进入“安装包管理”页面。
(2) 单击<上传>按钮,在弹出页面上单击<选择文件>按钮,选中分析组件安装包,然后单击<上传>按钮上传到系统。上传完成后,单击返回“融合部署”页面。
· 在安装统一数字底盘的时候也可以先上传对应所需的组件。
· 在WAN场景中,分析组件不支持独立部署,仅支持控制组件和分析组件融合部署,并且需要优先安装控制组件。
分析组件目前分为多个组件应用包,用户可按实际需要选择性上传,组件应用包与业务场景的关系如下表所示。
组件 |
说明 |
Campus |
WAN承载 |
WAN分支 |
DC |
Analyzer-Platform |
公共基础组件 |
必选 |
必选 |
必选 |
必选 |
Analyzer-Collector |
公共采集组件 |
必选 |
必选 |
必选 |
必选 |
Analyzer-Telemetry |
指标分析 |
必选 |
必选 |
必选 |
必选 |
Analyzer-WAN |
WAN应用分析 |
可选,默认不需要 |
必选 |
必选 |
可选 |
Analyzer-Simulation |
WAN网络仿真分析 |
不可选 |
可选 |
不可选 |
不可选 |
DTN_Manager |
WAN DTN主机管理 |
不可选 |
可选(须配合Analyzer- Simlation) |
不可选 |
不可选 |
Analyzer-User |
用户分析 |
必选 |
不可选 |
不可选 |
不可选 |
Analyzer-AV |
音视频分析 |
可选 |
不可选 |
可选 |
不可选 |
Analyzer-SLA |
服务质量分析 |
可选 |
必选 |
不可选 |
可选(须配合SeerCollecter采集器) |
Analyzer-TCP |
TCP流分析 |
可选(须配合SeerCollecter采集器),默认不需要 |
不可选 |
不可选 |
必选(须配合SeerCollecter采集器) |
Analyzer-Diagnosis |
诊断分析 |
必选 |
必选 |
必选 |
必选 |
Analyzer-AI |
AI智能预测 |
必选 |
必选 |
必选 |
必选 |
· Platform为公共基础组件,是必选安装包,其它组件根据实际业务场景需求进行选装。
· Telemetry组件是WAN/User/AV/SLA/TCP/Diagnosis/AI组件的基础,当安装这些组件时,Telemetry组件必装。
· DTN_MANAGER组件是WAN网络仿真中使用设备仿真功能的基础,当使用WAN仿真中的设备仿真,DTN_MANAGER组件必装。
· 在配置仿真组件参数时,若“设备仿真”选择“是”,则仿真组件和DTN_MANAGER组件需要绑定仿真网络,否则设备仿真功能不可用。
· 组件选择说明中:“必选”表示对应场景推荐安装该组件;“可选”表示除非明确需要该组件的功能,对应场景下一般不安装该组件;“不可选”表示对应场景下该组件无法正常工作。
· 当DC场景支持Netstream/sFlow时,需安装Analyzer-WAN组件
如果没有部署SeerCollecter采集器,需要取消TCP流分析(Analyzer-TCP组件)的勾选。
(1) 单击<安装>按钮,进入应用选择页面。
(2) 在应用选择页面勾选对应场景,系统将自动勾选对应场景需要安装的组件应用包。
图5-4 应用选择页面
选择应用时,应根据要部署的场景(Campus、DC、WAN)及表5-2中的对应关系合理选择。
· Campus场景默认只需要部署如下组件:Platform,Collector,Telemetry,Diagnosis,AI,User。需应用分析时可部署:AV,SLA。
· DC场景默认只需要部署如下组件:Platform,Collector,Telemetry,Diagnosis,TCP,WAN,AI,SLA。
· WAN承载场景默认只需要部署如下组件:Platform,Collector,Telemetry,Diagnosis,WAN,AI,SLA。
· WAN分支场景默认只需要部署如下组件:Platform,Collector,Telemetry,Diagnosis,WAN,AI。
(3) 在应用选择页面找到“公共服务”应用组所在区域,勾选Analyzer-Collector。该组件用于提供gRPC、netconf协议的数据采集任务。
分析组件和采集组件选择完成后,单击<下一步>按钮,进入安装包选择页面。如下图所示。
如果环境上同一组件存在多个版本的安装包,可在该页面进行下拉选择指定版本的安装包。
图5-5 安装包选择页面
安装包选择完成后,单击<下一步>按钮,进入资源配置页面,在该页面分析组件无需进行配置,直接单击<下一步>按钮进入参数配置页面。
Collector,Platform,Analyzer-WAN-Simulation,DTN_MANAGER和AI组件支持参数配置,其余组件均不需要进行参数配置。
(1) 采集组件参数配置
a. 节点配置
- 单机模式:采集组件不支持节点绑定,默认部署在Master节点。
- 集群模式:采集组件支持任选Master或者Worker中的一个或三个节点部署,不启用节点绑定默认部署在Master节点。
- 分析组件与控制组件分离部署,采集组件推荐部署在Master节点。
- 分析组件与控制组件融合部署,采集组件推荐部署在Worker节点,推荐网络方案为南向网络(需要独占Worker节点一个网口,用于承载南向网络),如果网络方案为南北向合一,部分采集程序由于依赖集群北向虚IP仍然会在Master节点运行。
b. 网络配置
配置采集组件的南向采集IP地址。根据在组件选择页面选择的网络方案确定:
- “南北向网络合一”(南向无网络)方案:无需配置网络,直接进行下一步。在条件允许的情况下,我们推荐南北向网络隔离,即使用“南向单协议”或者“南向双协议”方案,不推荐使用“南北向网络合一”方案。
- “南向单协议”方案:在本页面创建一个IPv4或IPv6网络。
- “南向双协议”方案:在本页面创建一个IPv4和一个IPv6网络。
c. 网络绑定
网络绑定原则:
- 南北向网络合一(南向无网络)方案无需配置资源绑定。
- 南向单协议栈方案中需要将网络指定为管理网络。
- 南向双协议栈方案中,需要将IPv4网络指定为管理网络,将IPv6网络指定为默认网络。
d. 该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
图5-6 参数配置页面
(2) 分析平台组件参数配置
分析平台组件参数配置页面如下图所示。
图5-7 分析平台参数配置页面
a. 节点配置
节点配置功能可将部分Pod绑定到指定的物理节点,解决在融合部署场景节点资源不足的情况下,分析组件抢占其他组件资源的问题:
- 单机模式下不支持节点绑定,分析组件将部署在唯一的单机节点上。
- 集群模式下,若开启节点绑定功能,可指定分析组件在集群中部署的节点名称,支持选择集群中的任意节点,要求选择的节点数可以是1个,或者3个及以上;若不开启节点标签,分析组件将默认部署在集群中的所有节点上。
b. 该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
(3) AI预测分析参数配置
AI预测分析组件参数配置页面如下图所示。
图5-8 AI预测分析参数配置页面
a. 负载配置
该配置用于指定AI预测任务负载容器数量,默认为“负载节点数量*2”,例如该配置下方的节点配置如果绑定了3个节点,将会创建6个负载容器执行AI预测任务。也可以选择“自定义”单选框,填写具体的数值,创建指定数量的负载容器。推荐使用默认配置。
b. 节点配置
该配置为AI预测负载容器指定部署节点,默认关闭。集群模式下可选择打开“节点绑定”功能。开启节点绑定后可选择部署AI预测任务负载容器的节点名称,在不开启节点绑定功能的情况下,将使用分析平台配置页面配置的节点信息。
c. 该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
(4) 仿真组件参数配置(仅WAN场景需要配置)
Analyzer-Simulation组件的参数配置页面如下图所示。
图5-9 参数配置页面
a. 节点绑定
仿真组件支持任选Master中的一个节点部署。
- 若“设备仿真”配置为“是”则可与仿真设备建立连接关系。需要在页面创建一个IPv4网络(用于管理仿真虚拟设备和DTN服务器所使用的网络),创建完成后仿真组件需要绑定该网络。
- 若“设备仿真”配置为“否”,则无需绑定仿真网络。
c. 该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
(5) DTN-Manager组件参数配置(仅WAN场景使用设备仿真时需要配置)
若仿真组件将“设备仿真”配置为“是”,则需继续配置DTN-Manager组件的参数。
a. 节点绑定:建议与仿真组件绑定在同一个节点上。
b. 网络配置:网络配置可参考仿真组件的网络配置。
c. 网络绑定:建议与仿真组件绑定在同一个网络上。
该页签下所有参数配置完成后,即可保存配置。
图5-10 DTN-Manager组件参数配置页面
在各组件的参数配置页面配置完参数并点击<应用>按钮以后,单击<部署>按钮,部署组件。
部署完成后,在组件管理页面可以查看组件的详细信息。
SeerAnalyzer部署完成后将在统一数字底盘中加载对应菜单项,登录统一数字底盘即可使用SeerAnalyzer功能。
统一数字底盘提供友好的GUI界面。具体登录方式如下:
(1) 在浏览器中输入统一数字底盘登录地址(默认登录地址:http://ip_address:30000/central/index.html),回车后会进入如下图所示登录界面。
¡ ip_address:为统一数字底盘所在的集群北向业务虚IP地址。
¡ 30000为端口号。
(2) 输入用户名密码登录统一数字底盘,缺省用户名为admin,密码为Pwd@12345。登录成功后进入主页面。
统一数字底盘的注册步骤请参见《H3C统一数字底盘部署指导》。
分析组件安装完成后,可90天内试用所有功能,超过试用期限后,需要获取License授权才能正常使用。
关于授权的申请和安装过程,请参见《H3C软件产品远程授权License使用指南》。
(1) 登录统一数字底盘,依次单击[系统>License管理>License信息]菜单项,进入License信息页面。
(2) 在页面中配置License Server信息的参数,详细介绍请参见下表。
参数 |
说明 |
IP地址 |
安装License Server的服务器上用于统一数字底盘和分析组件集群内各节点之间通信的IP地址 |
端口号 |
此处缺省值为“5555”,与License Server授权服务端口号保持一致 |
用户名 |
License Server中设置的客户端名称 |
密码 |
License Server中设置的客户端名称对应的密码 |
(3) 配置完成后,单击<连接>按钮与License Server建立连接,连接成功后统一数字底盘和分析组件可自动获取授权信息。
(1) 请登录Matrix页面,登录地址:https://ip_address:8443/matrix/ui。其中ip_address为统一数字底盘的北向业务虚IP,默认用户名为admin,密码为Pwd@12345。
(2) 在Matrix页面单击[部署>融合部署]菜单项,进入组件部署导航页面。
(3) 勾选“分析组件”,单击左上角<卸载>按钮,完成组件卸载。
(4) (本步骤为非必选操作)登录SeerCollector采集器所在服务器,进入/usr/local/itoaAgent目录,执行bash uninstall.sh命令手动清除数据。(如果是非root用户,请执行sudo bash uninstall.sh)然后使用ps -aux | grep agent | grep -v grep命令检查,命令执行后无输出则证明卸载干净。
图8-1 清除数据
在统一数字底盘上支持对组件进行保留配置升级。升级组件可能会导致业务中断,请谨慎操作。
· 分析组件不支持E7101之前版本及其补丁版本升级至E7101及其之后版本。
· 分析组件暂不支持升级失败后的回滚操作。
· 对分析组件整体升级,即所有组件全部升级,版本号统一变成升级后的版本号。
· 对分析组件整体升级时,必须先升级Analyzer-Collector组件,然后升级Analyzer-Platform基础组件,再升级Analyzer-Telemetry组件,最后升级其它组件(无顺序要求)。
· 升级Analyzer-Platform基础组件后,在任务管理模块下的flink类型的任务,任务参数(taskmanager进程内存限制、taskmanager容器内存限制、taskmanager容器cpu限制、taskmanager slot数、taskmanager副本数、并行度)会恢复成默认值。
· 补丁包升级时,请按照对应版本说明书升级。
(1) 请登录Matrix页面,单击[部署>融合部署]菜单项,进入部署管理页面。
图9-1 融合部署页面-展开组件信息
图9-2 融合部署-升级页面1
图9-3 融合部署-升级页面2
(4) 单击<上传>按钮,上传待升级的安装包。
(5) 安装包上传成功后,勾选安装包。融合部署页面进行升级操作,支持批量升级,即一次勾选多个不同组件的安装包。勾选完成后,单击<升级>按钮,完成组件升级。
· 在进行扩容操作之前,请提前备份Matrix、统一数字底盘和组件。若扩容失败,可使用备份文件对配置和数据进行恢复。
· 组件的扩容操作只能在统一数字底盘上进行。
统一数字底盘和组件扩容有以下两种情况:
· 单机部署模式扩容为集群部署模式,此种模式下,需在Matrix上同时增加两个Master节点并与原Master节点组成三机集群,然后依次扩容统一数字底盘和组件。
· 集群模式扩容,此种模式下,需在Matrix上先增加Worker节点,部署集群,然后扩容组件。
(2) 扩容Matrix
(3) 扩容采集组件和分析组件
(4) 扩容中间件
· 分析组件运行无故障
· COLLECTOR公共采集组件运行无故障
· 扩容节点的系统、磁盘分区需要与已部署的节点保持一致且网络连通
(1) 登录到分析组件单机/集群任一Master节点。
(2) 查看分析组件Pod运行状态,显示0代表正常,非0值代表异常。若服务异常,请联系H3C技术支持工程师解决。
[root@matrix01 ~]# kubectl get po -nsa |grep –v NAME |grep -v Completed | grep -iv Running | wc -l
(3) 查看采集器Pod运行状态,显示0代表正常,非0值代表异常。若服务异常,请联系H3C技术支持工程师解决。
[root@matrix01 ~]# kubectl get po -ncommon |grep –v NAME | grep -iv Running | wc -l
(4) 登录统一数字底盘,在[分析>健康分析>网络健康度]页面查看网络健康状况是否正常。
(5) 登录统一数字底盘,在[分析>分析选项>任务管理]页面查看任务状况是否正常运行。
· 如果COLLECTOR公共采集组件南向附加网络使用单独的一块网卡,那么新增的节点也需要两块网卡,并且在统一数字底盘组件扩容后以及采集组件扩容之前启用该节点的南向网卡。
· 分析组件E71xx版本仅支持在底盘E7101及以上版本上进行单机扩容。
如需扩容统一数字底盘,需先扩容Matrix,且Matrix扩容后,统一数字底盘扩容前,请不要进行其他操作。
(1) 在新增的两台服务器上部署Matrix,应使用和原Matrix节点相同版本的软件包。
(2) 登录单机部署Matrix页面,单击“部署”页签,在弹出的菜单中选择“集群”,进入集群部署页面。
图10-1 单机Matrix环境
(3) 单击Master节点区域的增加图标,增加2个Master节点。支持批量添加。
a. 扩容前请先进行备份操作,防止扩容失败后数据丢失。
图10-2 增加Master节点的提示(1)
b. 若已配置自定义虚IP,需确保自定义虚IP选择的网卡在集群各Master节点上都存在。
图10-3 增加Master节点的提示(2)
c. 单击提示框的<确定>按钮后,在弹出增加节点的对话框中配置相关参数。
图10-4 批量增加2个Master节点
d. 单击<应用>按钮后,即可完成增加Master节点的操作。
图10-5 完成2个Master节点增加完成
(4) 单击<开始部署>按钮,进行集群扩容。扩容时间较长,请耐心等待。
图10-6 集群扩容中
图10-7 集群扩容完成
(1) 登录Matrix,进入[部署>融合部署]页面。
(2) 单击<扩容>按钮,进入扩容页面。
图10-8 融合部署页面
(3) 配置相关参数后单击<应用>按钮,单击<扩容>按钮,等待扩容完成即可。
图10-9 融合部署页面扩容功能
(1) 进入Matrix的[部署>融合部署]页面。
(2) 单击<中间件管理>按钮,进入中间件管理页面。
(3) 分别单击seamq-analyse、seasqlcache-persistent、seasqlplus-sa操作列的扩容图标进行扩容操作。
图10-10 扩容中间件
集群部署模式扩容只需要扩容Matrix,不需要扩容统一数字底盘。
(1) 在新增的服务器上部署Matrix,应使用和原Matrix节点相同版本的软件包。
(2) 登录集群部署的Matrix页面,单击“部署”页签,在弹出的菜单中选择“集群”,进入集群部署页面。
(3) 单击Worker节点区域的增加图标,增加1个Worker节点。如需增加多个Worker节点,可重复单击增加图标;也可单击<批量增加>按钮,通过上传模板文件实现批量增加Worker节点。
图10-11 增加1个Worker节点
图10-12 批量增加Worker节点
(4) 单击<开始部署>按钮,进行集群扩容。扩容时间较长,请耐心等待。
图10-13 扩容完成
(1) 登录Matrix,进入[部署>融合部署]页面。
(2) 单击“扩容”图标,分别扩容Analyzer-Collector和Analyzer-Platform。
在集群环境中扩容Analyzer-Collector之前,必须绑定节点,否则将无法进行扩容。
图10-14 融合部署页面
图10-15 扩容Analyzer-Collector
图10-16 扩容Analyzer-Platform
(3) 在Analyzer-Collector和Analyzer-Platform的参数配置页面分别设置相关参数,然后单击<确定>按钮,等待扩容完成。
(1) 进入Matrix的[部署>融合部署]页面。
(2) 单击<中间件管理>按钮,进入中间件管理页面。
(3) 分别单击seamq-analyse、seasqlcache-persistent、seasqlplus-sa操作列的“扩容”图标进行扩容操作。
在配置扩容参数时,seasqlcache-persistent只能绑定1个或3个节点,而seasqlplus-sa新增节点的数量必须为偶数。
图10-17 扩容中间件
(1) 登录Matrix,点击“系统”页签,在弹出的菜单中选择“安全 > 安全策略”选项,进入安全策略页面。
(2) 单击<新增>按钮,进入增加安全策略页面。
(3) 在“基本设置”区域配置默认动作为“允许”。
(4) 在“规则信息”区域单击<新增>按钮,在弹出窗口中配置如下规则:
¡ 源地址为节点上除Matrix使用的网卡外的其它网卡IP。
¡ 协议类型为TCP。
¡ 目标端口必须输入为:
8101,44444,2379,2380,8088,6443,10251,10252,10250,10255,10256。
¡ 动作为允许。
(5) 配置完成后单击<确定>按钮。
必须将所有节点上除Matrix使用的网卡外的其它网卡IP都加入到安全策略中。
例如节点1上除Matrix使用的网卡外还有一个网卡的IP为1.1.1.1,节点2上除Matrix使用的网卡外的网卡IP为2.2.2.2,节点3上除Matrix使用的网卡外的网卡IP为3.3.3.3,则需要在安全策略的规则中增加3条规则,源地址分别为1.1.1.1、2.2.2.2、3.3.3.3,协议类型都是TCP,目标端口都是“8101,44444,2379,2380,8088,6443,10251,10252,10250,10255,10256”,动作都为允许。
图11-1 安全策略举例
(6) 开启被关掉的网卡,下面以eth33为例。
[root@node01 ~]# ifup eth33
(1) 节点上安装操作系统完成后,修改所有节点ssh端口
修改/etc/ssh/sshd_config配置文件。
将#Port 22改为想要修改的端口,如Port 2244。
重启sshd服务:
systemctl restart sshd.service
查看新端口是否监听:
netstat –anp | grep –w 2244
(2) 使用vim /opt/matrix/config/navigator_config.json命令进入navigator_config文件,查看该文件中是否存在sshPort字段,若存在,将该字段取值修改为用户想要指定的端口号(以12345为例);若不存在,则需手动添加该字段并为其赋值。
{
"productName": "uc",
"pageList": ["SYS_CONFIG", "DEPLOY", "APP_DEPLOY"],
"defaultPackages": [],
"allowDeployedPackageIds": ["UNIFIED-PLATFORM-BASE"],
"url": "http:””://${vip}:30000/central/index.html#/ucenter-deploy",
"theme":"darkblue",
"matrixLeaderLeaseDuration": 30,
"matrixLeaderRetryPeriod": 2,
"sshPort": 12345,
"sshLoginMode": "secret",
"features":{"stopNtpServerBeyondThreshold":"false"}
}
(3) 修改完成后,需重启Matrix服务
[root@node-worker ~]# systemctl restart matrix
(4) 查看新的端口号是否修改成功,若成功,则日志中最后一条信息如下。
[root@node-worker ~]# cat /var/log/matrix-diag/Matrix/Matrix/matrix.log | grep "ssh port"
2022-03-24T03:46:22,695 | INFO | FelixStartLevel | CommonUtil.start:232 | ssh port = 12345.
ssh_port说明:
· 此端口为ssh远程其他节点端口,所以必须保证集群中所有节点(包括Master和Worker),只能使用统一的ssh端口。
· 务必同时重启所有节点Matrix服务,Matrix服务会读取配置文件中ssh端口。
(5) 部署Matrix
参照Matrix安装部署指导部署Matrix。
统一数字底盘和分析组件需升级为支持ssh端口修改的版本(E6215及更高版本) ,在未升级到支持ssh端口修改版本之前请不要更改ssh 默认端口,升级完成后方可参照上述(1)、(2)、(3)步骤修改ssh端口。
分析组件在部署或升级的过程中可能因为超时导致部署或升级失败,建议重试或终止升级后重试。若重试依旧失败,需要联系技术服务人员协助定位问题。
统一数字底盘采用Kubernetes+Docker的微服务技术架构,当前底盘默认对微服务数量的限制是不超过300个,在园区场景单机融合部署时(指单机部署园区管控全套产品:统一数字底盘+vDHCP+SE+EIA+WSM+SA),微服务数量会超过该限制,需要对Kubernetes启动参数进行调整,当前微服务数量不会超过400个,具体操作步骤如下:
(1) 首先确认当前单机环境已部署Matrix,且系统运行正常。
(2) 进入后台命令行,编辑Kubernetes的配置文件:
vi /etc/systemd/system/kubelet.service.d/10-kubeadm.conf
将--max-pods=300改为--max-pods=400
(3) 保存配置文件之后,重启kubelet服务即可生效
systemctl daemon-reload && systemctl restart kubelet
请在相关网站(如https://pkgs.org/)获取numactl软件包并安装。
(1) 查询网卡pcie地址,例如某个环境的采集网卡pcie是:43:00.1。
lspci | grep Eth
(2) 查询网卡所在numa节点id。
cat /sys/bus/pci/devices/0000\:43\:00.1/numa_node
(3) 执行命令:numactl –H,查询numa对应节点是否有被分配内存。
以步骤(2)查询到的numa node 4节点为例(4即为查询到的numa节点id,id不固定,根据实际部署情况而定),查询结果表明numa node 4有内存:
node 4 cpus: 24 25 26 27 28 29 72 73 74 75 76 77
node 4 size: 32768 MB
node 4 free: 27161 MB
通常来说,超线程功能在BIOS里是默认开启的,可在BIOS中找到Hyper-Thread项,查看超线程是否开启。
图11-2 查看超线程功能是否开启
(1) 进入SeerCollector采集器后台,修改/etc/default/grub文件,增加amd_iommu=on iommu=pt配置内容。
[root@h3clinux1 ~]# vi /etc/default/grub
复制如下内容对原文件配置内容进行覆盖:
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto rhgb quiet amd_iommu=on iommu=pt"
GRUB_DISABLE_RECOVERY="true"
(2) 执行如下命令。
¡ 如果服务器是UEFI启动,执行如下命令
[root@h3clinux1 ~]# grub2-mkconfig -o /boot/efi/EFI/*/grub.cfg
¡ 如果服务器是普通模式启动,执行如下命令
[root@h3clinux1 ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
(3) 重启服务器。
[root@h3clinux1 ~]# reboot
问题现象:若采用“南北向网络合一”(南向无网络)方案部署公共采集组件且未安装network组件时,分析组件的SNMP-Trap采集功能不可用。
解决方案:进入[告警>告警配置>Trap过滤规则]页面,禁用“未定义Trap过滤”和“重复Trap过滤”规则,单击状态即可启用/禁用规则。
图11-3 禁用Trap过滤规则
问题现象:当按照4.2.2 数据盘RAID和分区规划推荐的数据盘分区规划进行分区,但是未修改文件系统类型导致部署分析组件失败。
解决方案:
(1) 检查文件系统类型是否为ext4类型:
[root@sa1 ~]# mount -l | grep sa_data
/dev/vdb2 on /sa_data/kafka_data type xfs (rw,relatime,seclabel,attr2,inode64,noquota)
/dev/vdb1 on /sa_data/mpp_data type ext4 (rw,relatime,seclabel,data=ordered)
(2) 如果不是ext4类型,请按照如下操作修改为ext4类型。注意:要先卸载采集组件,采集的kafka数据也放在/sa_data/kafka_data下面。
(3) 去掉挂载(注意顺序,/sa_data要在最后)。
[root@sa1 ~]# umount /sa_data/kafka_data
[root@sa1 ~]# umount /sa_data/mpp_data
(4) 使用指令mkfs.ext4 /dev/vdb1重新格式化分区(非ext4的数据盘分区都要执行)。
(5) 使用指令获取新的UUID,过滤条件为对应的磁盘分区,用‘|’隔开。
[root@sa1 ~]# ll /dev/disk/by-uuid | grep -E 'vdb1|vdb2'
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 -> ../../vdb2
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 cac87013-f014-40df-9aca-af76888b1823 -> ../../vdb1
(6) 使用vim /etc/fstab命令替换新的UUID以及修改分区格式类型为ext4。
(7) 查看修改后的文件。
[root@ sa1 ~]# cat /etc/fstab
#
# /etc/fstab
# Created by anaconda on Wed Dec 7 15:44:15 2022
#
# Accessible filesystems, by reference, are maintained under '/dev/disk‘
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=519f9af7-12ce-4567-b62c-2315cad14f56 / xfs defaults 0 0
UUID=83628a24-94f5-4937-b016-64d0f72bd98d /boot xfs defaults 0 0
UUID=3B96-1B3A /boot/efi vfat defaults,uid=0,gid=0,umask=0077,shortname=winnt 0 0
UUID=89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 /sa_data/kafka_data ext4 defaults 0 0
UUID=cac87013-f014-40df-9aca-af76888b1823 /sa_data/mpp_data ext4 defaults 0 0
UUID=51987141-f160-4886-ad51-bc788ec2176c /var/lib/docker xfs defaults 0 0
UUID=4e91a1b8-4890-4a41-be00-098ded6b8102 /var/lib/etcd xfs defaults 0 0
UUID=2554963b-03e7-4be4-b214-7350f2eb3df9 /var/lib/ssdata xfs defaults 0 0
#UUID=a22041b8-7c7c-4730-bc1f-634306145e36 swap swap defaults 0 0
(8) 执行mount -a进行挂载。
出现下报错为正常现象:
mount: 挂载点 /sa_data/kafka_data 不存在
mount: 挂载点 /sa_data/mpp_data 不存在
(9) 创建不存在的目录。
[root@ sa1 ~]# mkdir -p /sa_data/kafka_data
[root@ sa1 ~]# mkdir -p /sa_data/mpp_data
(10) 再次执行mount -a进行挂载即可完成文件系统类型的修改。
(11) 集群环境请在所有分析组件节点执行同样的操作。
问题现象:部署Analyzer-Platform组件失败,且报错“环境中出现如下异常:路径:/mpp_data未挂载”。
解决方案:请检查数据盘是否是按照本文要求进行规划、且文件系统类型是否为ext4格式,若不是则请按照本文要求重新规划磁盘。
这种现象主要是由于网络波动触发自动转换测量模式时,流标识符(FlowID)发生变化,导致聚合的5分钟和1小时数据可能不准确。网络恢复正常后,原始粒度趋势图与5分钟粒度趋势图、1小时粒度趋势图的数据将恢复一致。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!