01-正文
本章节下载: 01-正文 (4.98 MB)
目 录
5.1.3 根据需要清理各节点已记录的known_hosts信息
5.2.2 部署分析组件(统一数字底盘E0713及之后版本)
9.3 E62xx、E63xx到E65xx版本及E65xx版本间的升级过程
11.1 节点中存在多个网卡配置IP地址并且网卡UP时,如何增加安全策略?
11.4 园区场景单机融合部署时如何调整集群最大微服务数量限制?
11.8 如何限制使用kafka-console-consumer.sh消费Kafka监控时的超时时间?
11.11 如何解决在“南北向网络合一”(南向无网络)场景下分析组件的SNMP-Trap采集功能不可用问题?
11.12 如何解决从旧版本升级到E6501版本后SeerCollector采集器任务显示为“停止”状态?
分析组件聚焦于机器数据的价值挖掘,以大数据技术为基础,通过机器学习、深度学习等手段,从海量数据中分析有价值的信息,为企业网络、业务运维以及商业决策提供参考依据。分析组件通过对设备性能、用户接入、业务流量的实时数据采集和状态感知,通过大数据分析技术和人工智能算法,将网络的运行可视化,主动感知网络的潜在风险并自动预警。
分析组件支持Campus、WAN、DC等多个场景的数据分析。分析组件所分析的数据主要包括:网络设备运行数据、网络业务应用流量数据、用户接入和使用网络的记录数据等。
各场景功能简介:
· Campus场景:园区分析组件以用户体验保障为目的,通过Telemetry采集用户接入和使用网络的指标数据,使用大数据及AI技术分析用户体验健康度及体验问题,并结合网络设备健康度指标数据,关联分析影响用户体验的根因和处理建议。
· WAN场景:WAN分析组件作为广域网智能运维的核心引擎,通过采集状态数据、日志数据、流量数据等多维度网络信息,结合大数据、AI技术对数据进行汇总分析实现智能运维,提供全网健康度测评、应用流分析、容量预测,智能故障诊断等能力,是广域网智能运维的核心引擎。
· DC场景:数据中心分析组件以保障数据中心网络的高可靠、低延时为目的。通过全时全量采集网络设备运行信息,建立起全网的健康度评估体系,支持对数据中心内TCP\UDP的会话分析、应用的可视与分析、芯片级缓存监控和丢包分析。对数据中心网络运维实现了全方位支持与保障。
术语 |
说明 |
SeerCollector采集器 |
如果使用分析组件的TCP/UDP流分析、INT流分析功能,需要部署SeerCollector采集器 |
COLLECTOR采集组件 |
COLLECTOR采集组件为公共采集组件,提供采集服务,包括SNMP、GRPC、NETCONF等协议 |
分析组件基于统一数字底盘部署,支持物理机部署和虚拟机部署,推荐部署在物理服务器上。支持两种部署模式(单机模式和集群模式),相关说明如表2-1所示。
部署模式 |
所需服务器数量(台) |
部署说明 |
单机模式 |
1 |
1台服务器作为Master节点部署统一数字底盘,并将分析组件部署在统一数字底盘上 当网络规模较小且不要求高可靠性的场景才可以采用单机模式 |
集群模式 |
3+N |
3台服务器作为Master节点部署统一数字底盘。 · 当分析组件独立部署时: ¡ 3+N(N≥0)模式:支持分析组件部署在任意指定的3个Master节点+N(N≥0)个Worker节点上 · 当控制组件与分析组件融合部署时: ¡ 3机模式:控制组件和分析组件融合部署在同一套统一数字底盘集群的3个Master节点上 ¡ 3+1模式:统一数字底盘和控制组件部署在3个Master节点上, 分析组件部署在一个Worker节点上 ¡ 3+N(N≥3)模式:统一数字底盘和控制组件部署在3个Master节点上,分析组件部署在N个Worker节点上 |
对于不同的场景和网络规模,分析组件所分析的业务量存在较大的差异。其中,产生大业务量的主要是网络业务应用流量数据。分析组件支持独立部署,同时支持与场景组件融合部署。
硬件配置需求,是在部署基础平台及对应场景组件的环境中,仅根据分析组件所能够承载的业务量评估的结果,如需考虑场景组件所能承载的业务量,请进一步评估硬件资源需求。不同的业务量所需的硬件配置有差异,详见如下:
· 对于安装部署统一数字底盘的服务器,其CPU架构需为x86-64(Intel64/AMD64),系统硬盘为HDD(SAS/SATA)硬盘或SSD硬盘,数据硬盘可采用SSD固态硬盘或机械硬盘(SATA/SAS),磁盘条件允许时建议RAID5。RAID卡不低于1GB写缓存,支持数据掉电保护,并且服务器必须支持安装CentOS 7.6及以上版本的操作系统。
· 分析组件不同版本适配的CPU架构型号不同,具体请关注版本配套发布的文件。
· 数据盘总容量一定的情况下,磁盘数量越多读写性能越好,例如:6块2TB的硬盘读写性能优于3块4TB的硬盘。
· 如果使用分析组件的TCP流分析、INT流分析功能,需要部署SeerCollector采集器。请参见“2.2 SeerCollector采集器的服务器配置要求”。
· 数据盘必须使用独立的磁盘。
为了确保业务的正常运行,必须将服务器的CPU供电模式设置为高性能(performance)模式,并关闭RAID卡的PR(Patrol Read,巡读)和CC(Consistency Check,一致性校验)功能(如不支持PRCC,则无需关闭)。具体操作方式请参见服务器/RAID卡相关产品手册,或联系服务器/RAID卡的生产厂家技术支持人员。
不同业务规模下,Campus场景对网口的要求基本一致,统一说明如下:
· 默认情况下,推荐南向采集网络与北向网络分离,分别使用不同的网口。条件不具备时也可以共用一个网口。
· 普通模式:推荐2个网口,2*1Gbps及以上带宽,条件允许时建议北向网口采用10Gbps及以上带宽。
· 冗余模式:工作模式推荐配置为mode2或mode4,4个网口,4*1Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*1Gbps + 2*1Gbps,条件允许时建议北向网口采用10Gbps及以上带宽。
表2-2 Campus场景统一数字底盘+分析组件服务器节点硬件配置需求(单机部署)
硬件节点配置 |
可支持最大管理规模 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|
分析节点 |
1 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:2.4TB(RAID后容量)及以上 · 数据盘:2TB(RAID后容量)及以上,需要2块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:2000 · Switch+AC+AP:400 |
1 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:2.4TB(RAID后容量)及以上 · 数据盘:2TB(RAID后容量)及以上,需要2块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:5000 · Switch+AC+AP:1000 |
|
1 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:2.4TB(RAID后容量)及以上 · 数据盘:3TB(RAID后容量)及以上,需要2块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:10000 · Switch+AC+AP:2000 |
|
1 |
· CPU:24核(总物理核数),2.0GHz主频及以上 · 内存:224G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:4TB(RAID后容量)及以上,需要3块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:20000 · Switch+AC+AP:4000 |
|
1 |
· CPU:28核(总物理核数),2.0GHz主频及以上 · 内存:256G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:5TB(RAID后容量)及以上,需要4块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:40000 · Switch+AC+AP:8000 |
|
1 |
· CPU:32核(总物理核数),2.0GHz主频及以上 · 内存:288G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:7TB(RAID后容量)及以上,需要5块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:60000 · Switch+AC+AP:12000 |
|
1 |
· CPU:40核(总物理核数),2.0GHz主频及以上 · 内存:384G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:11TB(RAID后容量)及以上,需要8块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:100000 · Switch+AC+AP:20000 |
表2-3 Campus场景统一数字底盘+分析组件服务器节点硬件配置需求(集群部署)
硬件节点配置 |
可支持最大管理规模 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|
分析节点 |
3 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:128G及以上 · 系统盘:2.4TB(RAID后容量)及以上 · 数据盘:2TB(RAID后容量)及以上,需要2块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:2000 · Switch+AC+AP:400 |
3 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:128G及以上 · 系统盘:2.4TB(RAID后容量)及以上 · 数据盘:2TB(RAID后容量)及以上,需要2块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:5000 · Switch+AC+AP:1000 |
|
3 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:128G及以上 · 系统盘:2.4TB(RAID后容量)及以上 · 数据盘:2TB(RAID后容量)及以上,需要2块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:10000 · Switch+AC+AP:2000 |
|
3 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:160G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:3TB(RAID后容量)及以上,需要3块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:20000 · Switch+AC+AP:4000 |
|
3 |
· CPU:24核(总物理核数),2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:4TB(RAID后容量)及以上,需要3块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:40000 · Switch+AC+AP:8000 |
|
3 |
· CPU:28核(总物理核数),2.0GHz主频及以上 · 内存:224G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:5TB(RAID后容量)及以上,需要4块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:60000 · Switch+AC+AP:12000 |
|
3 |
· CPU:32核(总物理核数),2.0GHz主频及以上 · 内存:256G及以上 · 系统盘:3TB(RAID后容量)及以上 · 数据盘:8TB(RAID后容量)及以上,需要6块及以上同型硬盘 · ETCD盘:50GB(RAID后容量)及以上,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 |
· 在线用户:100000 · Switch+AC+AP:20000 |
表2-4 分析组件单机部署(x86-64(Intel64/AMD64)架构)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
1 |
· CPU:20核(总物理核数),2.0GHz主频及以上 · 内存:256GB及以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:8TB(RAID后容量)及以上,需要3块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:配置RAID后容量50GB及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 · 网口 ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式:4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
50 |
1000VM,约2000TCP流/秒 |
按每个VM 2条TCP流/秒 |
表2-5 分析组件单机部署(x86-64 海光服务器)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
1 |
· CPU:48核(总物理核),2.2GHz主频及以上,推荐:2 * Hygon C86 7265 24核2.2GHz主频 · 内存:256GB及以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:8TB(RAID后容量)及以上,需要3块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:配置RAID后容量50GB及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 · 网口 ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式:4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
50 |
1000VM,约2000TCP流/秒 |
按每个VM 2条TCP流/秒 |
若选用麒麟系统,网卡bond必须配置IP地址,否则bond的网卡不可用。
表2-6 分析组件单机部署(ARM 鲲鹏服务器)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
1 |
· CPU:64核(总物理核),2.6GHz主频及以上;推荐:2 * Kunpeng 920 5232 32核2.6GHz主频 · 内存:256GB及以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:8TB(RAID后容量)及以上,需要3块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:配置RAID后容量50GB及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 · 网口 ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式:4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
50 |
1000VM,约2000TCP流/秒 |
按每个VM 2条TCP流/秒 |
表2-7 分析组件单机部署(ARM飞腾服务器)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
1 |
· CPU:128核(总物理核),2.1GHz主频及以上;推荐:2 * 飞腾S2500 64核2.1GHz主频 · 内存:256GB及以上 · 系统盘:1.92TB(RAID后容量)及以上 · 数据盘:8TB(RAID后容量)及以上,需要3块及以上同型硬盘 · ETCD盘:配置RAID后容量50GB及以上 · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式:4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding |
50 |
1000VM,约2000TCP流/秒 |
按每个VM 2条TCP流/秒 |
表2-8 分析组件集群部署(x86-64(Intel64/AMD64)架构)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
3 |
· CPU:20核(总物理核数),2.0GHz主频以上 · 内存:192GB及以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:数据盘:8TB(RAID后容量)及以上,需要3块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:50GB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
50 |
1000VM,约2000TCP流/秒 |
按每个VM 2条TCP流/秒 |
3 |
· CPU:24核(总物理核数),2.0GHz主频以上 · 内存:256GB及以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:12TB(RAID后容量)及以上,需要5块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:50GB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
100 |
3000VM,约6000TCP流/秒 |
按每个VM 2条TCP流/秒 |
|
3 |
· CPU:32核(总物理核数),2.0GHz主频以上 · 内存:256GB以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:24TB(RAID后容量)及以上,需要7块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:50GB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · RAID卡:1GB Cache以上,支持数据掉电保护且超级电容必须在位 · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
200 |
6000VM,约12000TCP流/秒 |
按每个VM 2条TCP流/秒 |
表2-9 分析组件集群部署(x86-64 海光服务器)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
3 |
· CPU:48核(总物理核),2.2GHz主频及以上;推荐:2 * Hygon C86 7265 24核2.2GHz主频 · 内存:256GB以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:24TB(RAID后容量)及以上,需要7块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:配置RAID后容量50GB及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
200 |
5000VM,约10000TCP流/秒 |
按每个VM 2条TCP流/秒 |
表2-10 分析组件集群部署(ARM鲲鹏服务器)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
3 |
· CPU:64核(总物理核),2.6GHz主频及以上;推荐:2 * Kunpeng 920 5232 32核2.6GHz主频 · 内存:256GB以上 · 系统盘:1.92TB(RAID后容量)及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · 数据盘:24TB(RAID后容量)及以上,需要7块及以上同型硬盘,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘 · ETCD盘:配置RAID后容量50GB及以上,推荐使用SSD固态硬盘或7.2K RPM以上HDD机械硬盘,安装路径:/var/lib/etcd · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
200 |
5000VM,约10000TCP流/秒 |
按每个VM 2条TCP流/秒 |
表2-11 分析组件集群部署(ARM飞腾服务器)(统一数字底盘+SeerAnalyzer)
硬件节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
3 |
· CPU:128核(总物理核),2.1GHz主频及以上;推荐:2 * 飞腾S2500 64核2.1GHz主频 · 内存:256GB以上 · 系统盘:1.92TB(RAID后容量)及以上 · 数据盘:12TB(RAID后容量)及以上,需要7块及以上同型硬盘 · ETCD盘:配置RAID后容量50GB及以上 · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式:4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding |
100 |
2000VM,约4000TCP流/秒 |
按每个VM 2条TCP流/秒 |
· CPU:128核(总物理核),2.1GHz主频及以上;推荐:2 * 飞腾S2500 64核2.1GHz主频 · 内存:256GB以上 · 系统盘:1.92TB(RAID后容量)及以上 · 数据盘:24TB(RAID后容量)及以上,需要7块及以上同型硬盘 · ETCD盘:配置RAID后容量50GB及以上 · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式:4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding |
200 |
5000VM,约10000TCP流/秒 |
按每个VM 2条TCP流/秒 |
可根据整个数据中心VM的总数量、按每个VM 2条TCP流/秒,计算整体的TCP流大小,来判断所需使用的硬件配置规格。
在WAN场景中,分析组件不支持独立部署,仅支持控制组件和分析组件融合部署,并且需要优先安装控制组件。对于与控制组件融合部署的硬件配置,请参见《AD-NET硬件配置指导》。
不同业务规模下,Campus场景对网口的要求基本一致,统一说明如下:
· 默认情况下,推荐南向采集网络与北向网络分离,分别使用不同的网口。条件不具备时也可以共用一个网口。
· 普通模式:推荐2个网口,2*1Gbps及以上带宽,条件允许时建议北向网口采用10Gbps及以上带宽。
· 冗余模式:工作模式推荐配置为mode2或mode4,4个网口,4*1Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*1Gbps + 2*1Gbps,条件允许时建议北向网口采用10Gbps及以上带宽。
表2-12 Campus场景统一数字底盘+分析组件服务器虚拟机节点配置需求(单机部署)
虚拟机节点配置 |
可支持最大管理规模 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|
分析节点 |
1 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:2.4TB及以上 · 数据盘:2TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:2000 · Switch+AC+AP:400 |
分析节点 |
1 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:2.4TB及以上 · 数据盘:2TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:5000 · Switch+AC+AP:1000 |
分析节点 |
1 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:2.4TB及以上 · 数据盘:3TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:10000 · Switch+AC+AP:2000 |
分析节点 |
1 |
· vCPU:24*2核,2.0GHz主频及以上 · 内存:224G及以上 · 系统盘:3TB及以上 · 数据盘:4TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:20000 · Switch+AC+AP:4000 |
分析节点 |
1 |
· vCPU:28*2核,2.0GHz主频及以上 · 内存:256G及以上 · 系统盘:3TB及以上 · 数据盘:5TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:40000 · Switch+AC+AP:8000 |
分析节点 |
1 |
· vCPU:32*2核,2.0GHz主频及以上 · 内存:288G及以上 · 系统盘:3TB及以上 · 数据盘:7TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:60000 · Switch+AC+AP:12000 |
分析节点 |
1 |
· vCPU:40*2核,2.0GHz主频及以上 · 内存:384G及以上 · 系统盘:3TB及以上 · 数据盘:11TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:100000 · Switch+AC+AP:20000 |
表2-13 Campus场景统一数字底盘+分析组件服务器虚拟机节点配置需求(集群部署)
虚拟机节点配置 |
可支持最大管理规模 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|
分析节点 |
3 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:128G及以上 · 系统盘:2.4TB及以上 · 数据盘:2TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:2000 · Switch+AC+AP:400 |
分析节点 |
3 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:128G及以上 · 系统盘:2.4TB及以上 · 数据盘:2TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:5000 · Switch+AC+AP:1000 |
分析节点 |
3 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:128G及以上 · 系统盘:2.4TB及以上 · 数据盘:2TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:10000 · Switch+AC+AP:2000 |
分析节点 |
3 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:160G及以上 · 系统盘:3TB及以上 · 数据盘:3TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:20000 · Switch+AC+AP:4000 |
分析节点 |
3 |
· vCPU:24*2核,2.0GHz主频及以上 · 内存:192G及以上 · 系统盘:3TB及以上 · 数据盘:4TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:40000 · Switch+AC+AP:8000 |
分析节点 |
3 |
· vCPU:28*2核,2.0GHz主频及以上 · 内存:224G及以上 · 系统盘:3TB及以上 · 数据盘:5TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:60000 · Switch+AC+AP:12000 |
分析节点 |
3 |
· vCPU:32*2核,2.0GHz主频及以上 · 内存:256G及以上 · 系统盘:3TB及以上 · 数据盘:8TB及以上,硬盘随机读写不低于100M/s,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd |
· 在线用户:100000 · Switch+AC+AP:20000 |
· 分配给虚拟机的CPU、内存和磁盘必须符合推荐容量要求且确保有对应容量的物理资源,禁止启用超配模式(超额分配虚机资源)。
· 安装ETCD的磁盘必须与安装系统的其他部分的磁盘分别对应不同的物理硬盘上。
· 仅支持H3C CAS虚拟化方案,CAS虚拟化需要挂本地存储,RAID后容量达到配置表的容量且需要3块及以上同型硬盘做本地RAID。
表2-14 DC场景统一数字底盘+分析组件服务器虚拟机节点配置需求(单机部署)
虚拟机节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
1 |
· vCPU:20*2核,2.0GHz主频及以上 · 内存:256GB及以上 · 系统盘:1.92TB及以上 · 数据盘:8TB及以上,随机读写200M/s以上,不得采用共享存储 · ETCD盘:50GB及以上,SSD固态硬盘,安装路径:/var/lib/etcd · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps |
50 |
1000VM,约2000TCP流/秒 |
按每个VM 2条TCP流/秒 |
表2-15 DC场景统一数字底盘+分析组件服务器虚拟机节点配置需求(集群部署)
虚拟机节点配置 |
可支持最大设备数量 |
可支持最大TCP连接数 |
备注 |
||
节点名称 |
节点配置数量 |
单节点详细配置 |
|||
分析节点 |
3 |
· vCPU:20*2核,2.0GHz主频以上 · 内存:192GB及以上 · 系统盘:1.92TB及以上 · 数据盘:8TB及以上,随机读写200M/s以上,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps ¡ 集群间10GE及以上带宽 |
50 |
1000VM,约2000TCP流/秒 |
按每个VM 2条TCP流/秒 |
3 |
· vCPU:24*2核,2.0GHz主频以上 · 内存:256GB及以上 · 系统盘:1.92TB及以上 · 数据盘:12TB及以上,随机读写200M/s以上,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps ¡ 集群间10GE及以上带宽 |
100 |
3000VM,约6000TCP流/秒 |
按每个VM 2条TCP流/秒 |
|
3 |
· vCPU:32*2核,2.0GHz主频以上 · 内存:256GB以上 · 系统盘:1.92TB及以上 · 数据盘:12TB及以上,随机读写200M/s以上,不得采用共享存储 · ETCD盘:50GB及以上,安装路径:/var/lib/etcd · 网口: ¡ 普通模式:2个网口,2*10Gbps及以上带宽 ¡ 冗余模式(工作模式推荐配置为mode2或mode4):4个网口,4*10Gbps及以上带宽,每2个网口组成1组Linux Bonding:2*10Gbps + 2*10Gbps ¡ 集群间10GE及以上带宽 |
200 |
6000VM,约12000TCP流/秒 |
按每个VM 2条TCP流/秒 |
· 可根据整个数据中心VM的总数量、按每个VM 2条TCP流/秒,计算整体的TCP流大小,来判断所需使用的硬件配置规格。
· 分配给虚拟机的CPU、内存和磁盘必须符合推荐容量要求且确保有对应容量的物理资源,禁止启用超配模式(超额分配虚机资源)。
· 仅支持H3C CAS虚拟化方案,CAS虚拟化需要挂本地存储,RAID后容量达到配置表的容量且需要3块及以上同型硬盘做本地RAID。
· DC采集器不支持虚拟机部署。
在WAN场景中,分析组件不支持独立部署,仅支持控制组件和分析组件融合部署,并且需要优先安装控制组件。对于与控制组件融合部署的硬件配置,请参见《AD-NET硬件配置指导》。
支持如下操作系统:
· common_Linux-1.1.2_V9R1B07D014
· H3Linux 2.0.2
· Red Hat Enterprise Linux 8.4
· Red Hat Enterprise Linux 8.6
· Red Hat Enterprise Linux 8.8
· Kylin Linux Advanced Server release V10SP2
· 统信UOS V20操作系统
· 集群中所有节点必须安装相同版本的操作系统。
· 如需使用Kylin V10SP2、统信 V20、Red Hat Enterprise Linux 8.4、Red Hat Enterprise Linux 8.6、Red Hat Enterprise Linux 8.8操作系统,需用户自行准备。
分析组件运行在统一数字底盘上,部署分析组件前需要先安装统一数字底盘。
· 如果使用分析组件的TCP/UDP流分析、INT流分析功能,需要部署SeerCollector采集器。
· SeerCollector采集器在分析组件中的管理页面菜单路径为[分析>分析选项>采集管理>采集器管理>先知采集器]。
· SeerCollector采集器若使用Intel品牌的CPU,请确保其型号为E5-2690 v4及以上(可执行lscpu命令查看具体CPU型号),否则将导致SeerCollector采集器无法正常使用。
SeerCollector采集器需安装在物理服务器上。硬件配置需求如下所示。
表2-16 SeerCollector采集器服务器硬件规格(x86-64(Intel64)架构)
配置要求 |
· CPU:Intel(R) Xeon(R) 可扩展处理器(推荐使用Platinum或Gold系列),2.0GHz主频及以上,核数不低于20 · 内存:128G及以上 · 系统盘:2*600GB(建议RAID1)及以上,HDD(SAS/SATA)或SSD硬盘 · 网卡(冗余模式):1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond ¡ 采集网口x86服务器推荐Intel 82599芯片的网卡,请提前规划好哪张网卡需要用于采集,记录好网卡的信息(名字、MAC),规划并设置好IP地址等操作,配置下发后,采集网卡被DPDK接管,通过Linux内核命令将看不到使用的网卡 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡 ¡ 禁止对管理网口进行DPDK绑定 |
· SeerCollector采集器需要确保采集网卡对应的numa节点已被分配内存,否则无法识别网卡,将导致SeerCollector运行失败。具体步骤请参考11.7 如何查看numa节点是否被分配内存?。若未分配内存,需要尝试调整内存条位置,确保对应numa节点有被分配内存。
· SeerCollector采集器若选用海光服务器,不能手动关闭超线程。如何查看超线程功能是否开启请参考11.9 如何查看是否开启超线程?。
· SeerCollector采集器若选用海光服务器,首次安装完操作系统,需要开启硬件虚拟化功能,否则dpdk网卡不能正常收包,操作步骤请参考11.10 如何开启硬件虚拟化功能?。
· SeerCollector采集器若使用飞腾服务器,需要确保前16核对应的numa节点被分配内存(例如一个numa节点有8个核,node1为第0到第7核,node2为第8到第15核,则需要保证node1和node2被分配内存),查看是否被分配内存请参考11.7 如何查看numa节点是否被分配内存?。
表2-17 SeerCollector采集器服务器硬件规格(x86-64 海光服务器)
属性 |
配置要求 |
采集器节点 |
· CPU:48核(总物理核),2.2GHz主频及以上,推荐:2 * Hygon C86 7265 24核2.2GHz主频 · 内存:总容量不少于128GB,并配备至少8条内存条(例如128GB容量则需要8条16GB内存) · 系统盘:2*600GB,磁盘做RAID1,HDD(SAS/SATA)或SSD硬盘 · 网卡:1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond模式 ¡ 采集网口x86服务器推荐Intel 82599芯片的网卡,请提前规划好哪张网卡需要用于采集,记录好网卡的信息(名字、MAC),规划并设置好IP地址等操作,配置下发后,网卡被DPDK接管,通过Linux内核命令将看不到使用的网卡。 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡。 ¡ 禁止对管理网口进行DPDK绑定。 |
表2-18 SeerCollector采集器服务器硬件规格(ARM 鲲鹏服务器)
属性 |
配置要求 |
采集器节点 |
· CPU:64核(总物理核),2.6GHz主频及以上;推荐:2 * Kunpeng 920 5232 32核2.6GHz主频 · 内存:128GB及以上 · 系统盘:2*600GB,磁盘做RAID1,HDD(SAS/SATA)或SSD硬盘 · 网卡:1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond模式 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡。 ¡ 禁止对管理网口进行DPDK绑定。 |
表2-19 SeerCollector采集器服务器硬件规格(ARM飞腾服务器)
属性 |
配置要求 |
采集器节点 |
· CPU:128核(总物理核),2.1GHz主频及以上;推荐:2 * 飞腾S2500 64核2.1GHz主频 · 内存:128GB及以上 · 系统盘:2*600GB,磁盘做RAID1,HDD(SAS/SATA)或SSD硬盘 · 网卡:1个10Gbps采集网口,1个10Gbps管理网口 ¡ 采集网口必须支持DPDK技术,不能配置为bond模式,管理网口可配置bond模式 ¡ 采集网口支持Mellanox4[ConnectX-3]网卡,推荐Mellanox Technologies MT27710 Family、Mellanox Technologies MT27700两个型号,如果Mellanox4[ConnectX-3]网卡作为采集网卡,管理网卡必须使用其他的网卡。目前ARM版本仅支持Mellanox网卡。 ¡ 禁止对管理网口进行DPDK绑定。 |
· 分析组件不同版本适配的CPU架构型号不同,具体请关注版本配套发布的文件。
· 采集服务器上需要两个网口:一个网口负责采集业务,用于接收网络设备发送过来的镜像报文;另一个负责管理业务,用于与分析组件数据交互。
· 若选用麒麟系统,网卡bond必须配置IP地址,否则bond的网卡不可用。
表2-20 SeerCollector采集网卡支持列表(x86-64(Intel64)架构)
厂商 |
芯片 |
型号 |
型号系列 |
支持版本 |
Intel |
JL82599 |
H3C UIS CNA 1322 FB2-RS3NXP2D-2端口万兆光接口网卡(SFP+) |
CNA-10GE-2P-560F-B2 |
所有版本 |
JL82599 |
H3C UIS CNA 1322 FB2-RS3NXP2DBY-2端口万兆光接口网卡(SFP+) |
CNA-10GE-2P-560F-B2 |
所有版本 |
|
X550 |
H3C UNIC CNA 560T B2-RS33NXT2A-2端口万兆电接口网卡-1*2 |
|
所有版本 |
|
X540 |
UN-NIC-X540-T2-T-10Gb-2P(电接口网卡) |
|
所有版本 |
|
X520 |
UN-NIC-X520DA2-F-B-10Gb-2P |
|
所有版本 |
|
Mellanox |
MT27710 Family [ConnectX-4 Lx] |
NIC-ETH540F-LP-2P |
Mellanox Technologies MT27710 Family |
所有版本 |
MT27712A0-FDCF-AE[ConnectX-4Lx] |
NIC-620F-B2-25Gb-2P |
|
所有版本 |
|
Mellanox Technologies MT28908 Family [ConnectX-6] |
IB-MCX653105A-HDAT-200Gb-1P |
Mellanox Technologies MT28908 Family |
E6508及之后版本 |
|
Broadcom |
BCM57414 |
NetXtreme-E 10Gb/25Gb RDMA Ethernet Controller(rev 01) |
|
所有版本 |
磁盘RAID规划 |
分区名称 |
挂载点 |
最小容量 |
备注 |
2*600GB,RAID1 |
/dev/sda1 |
/boot/efi |
200MB |
EFI System Partition类型,仅UEFI模式需要配置该分区 |
/dev/sda2 |
/boot |
1024MB |
- |
|
/dev/sda3 |
/ |
590GB |
|
|
/dev/sda4 |
swap |
4GB |
swap类型 |
· SeerCollector采集器不需要数据盘存储。
· 当系统磁盘大于1.5T时,SeerCollector采集器系统盘可自动分区规划,否则可参考表2-21对系统盘手动分区规划。
表2-22 SeerCollector支持系统及CPU参考表
CPU |
操作系统 |
内核版本 |
备注 |
海光(X86) |
H3Linux 1.3.1 |
5.10.38-21.hl05.el7.x86_64 |
支持所有版本 |
H3Linux 1.1.2 |
3.10.0-957.27.2.el7.x86_64 |
支持所有版本 |
|
麒麟操作系统V10SP2 |
4.19.90-24.4.v2101.ky10.x86_64 |
支持所有版本 |
|
H3Linux 2.0.2 |
5.10.0-60.72.0.96.hl202.x86_64 |
支持E6505及之后版本 |
|
5.10.0-136.12.0.86.4.nos1.x86_64 |
支持E6507及之后版本 |
||
Intel(X86) |
麒麟操作系统V10SP2 |
4.19.90-24.4.v2101.ky10.x86_64 |
支持所有版本 |
H3Linux 1.1.2 |
3.10.0-957.27.2.el7.x86_64 |
支持所有版本 |
|
3.10.0-1160.31.1.hl09.el7.x86_64 |
支持E6505及之后版本 |
||
H3Linux 2.0.2 |
5.10.0-60.18.0.50.1.hl202.x86_64 |
支持E6310之后的版本 |
|
5.10.0-136.12.0.86.4.hl202.x86_64 |
支持E6505及之后版本 |
||
5.10.0-136.12.0.86.4.nos1.x86_64 |
支持E6507及之后版本 |
||
Red Hat Enterprise Linux 8.8 |
4.18.0-477.13.1.el8_8.x86_64 |
支持E6508及之后版本 |
|
鲲鹏(ARM) |
麒麟操作系统V10 |
4.19.90-11.ky10.aarch64 |
支持所有版本 |
麒麟操作系统V10SP2 |
4.19.90-24.4.v2101.ky10.aarch64 |
支持所有版本 |
|
H3Linux 2.0.2 |
5.10.0-60.72.0.96.hl202.aarch64 |
E6310之后的版本 |
|
飞腾(ARM) |
麒麟操作系统V10SP2 |
4.19.90-24.4.v2101.ky10.aarch64 |
支持所有版本 |
查看内核版本的方法如下:使用压缩软件(如WinRAR)打开“.iso”文件后,进入Packages目录,找到名称为kernel-version.rpm的文件,其中version代表内核版本。例如,文件路径Packages\kernel-3.10.0-957.27.2.el7.x86_64.rpm对应的内核版本为3.10.0-957.27.2.el7.x86_64。
推荐使用统一数字底盘自带的操作系统。
· 若服务器使用的操作系统低于H3Linux_K310_V112版本,请务必重装系统,避免采集业务配置失败。
· 若SeerCollector采集器需要重装或更新操作系统,必须先卸载SeerCollector采集器。
请根据1. 硬件配置需求,安装部署2. 操作系统需求中对应的操作系统,完成对SeerCollector采集器操作系统的安装。配置采集器时,将自动安装采集器软件包。
· 关闭SeerCollector采集器的防火墙并关闭防火墙开机自动启动功能。
a. 执行systemctl stop firewalld命令关闭防火墙。
b. 执行systemctl disable firewalld命令关闭防火墙自启动。
c. 执行systemctl status firewalld命令查看防火墙状态。当状态为Active: inactive (dead)时,表示防火墙已关闭。
[root@localhost ~]# systemctl status firewalld
firewalld.service - firewalld - dynamic firewall daemon
Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)
Active: inactive (dead)
Docs: man:firewalld(1)
· 为了防止与业务路由冲突,需在操作系统的/etc/sysconfig/network-scripts/路径下找到以ifcfg为前缀的采集网卡配置文件,修改DEFROUTE参数值为no,进行保存即可。
用户不需要安装客户端软件,使用浏览器即可访问分析组件。推荐使用的浏览器为Google Chrome 70及以上版本。
安装环境请参考表2-23中所示的各个检测项目,确保安装统一数字底盘的条件已经具备。
检测项 |
检测标准 |
|
服务器 |
硬件检查 |
· 请检查硬件是否符合要求(包括CPU、内存、硬盘、网卡等) · 请分别检查分析组件和SeerCollector采集器是否支持CentOS 7.6及以上版本的操作系统 |
软件检查 |
请确保服务器已配置磁盘阵列 |
|
客户端 |
请确保浏览器版本符合要求 |
|
服务器和操作系统兼容性 |
请参见以下链接,查看H3C服务器和操作系统的兼容性列表:https://iconfig-chl.h3c.com/iconfig/OSIndex |
H3Linux操作系统的相关通用配置可以参考CentOS 7.6相关文档。
上传应用安装包之后,请参见如下命令对软件包执行MD5验证,确保软件包的完整性和正确性。
(1) 查看已上传的安装包。
[root@node1~]# cd /opt/matrix/app/install/packages/
[root@node1~]# ls
BMP_Report_E0722_x86.zip UDTP_Core_E0722_x86.zip
…略…
(2) 查看安装包的MD5值,以UDTP_Core_E0722_x86.zip为例。
[root@node1~]# md5sum UDTP_Core_E0722_x86.zip
2b8daa20bfec12b199192e2f6e6fdeac UDTP_Core_E0722_x86.zip
(3) 将上述步骤中获取到的MD5值与发布的软件版本文件MD5值进行比对,若一致,则软件包正确。
· 解决方案组网可以采用南向单协议栈。
· 网络需要在Analyzer-Collector公共采集组件安装时进行配置,可参考图5-11、图5-12、图5-14。
· 在规划南向网络的IP地址池时,IP网段区间不能包含北向业务虚IP地址,否则可能造成IP地址冲突。
· 只有在使用WAN仿真分析组件应用中的设备仿真功能时,才需要配置WAN仿真分析IP地址,具体配置方式请参考2.6.2 分析组件网络规划。
· 北向网络:即统一数字底盘中设置的北向业务虚IP,是集群对外提供服务的网络。
· 南向网络:COLLECTOR公共采集组件和SeerCollector采集器用于接收来自设备端的采集数据所使用的网络。需确保南向网络和待采集设备之间可达。目前南向支持三种网络方案,请根据实际组网选择:
¡ 南北向网络合一(南向无网络):分析组件不配置单独的南向网络。上云环境,仅支持此种网络。
¡ 南向单协议栈:创建一个网络并指定为南向网络,采集网络使用IPv4或IPv6。
¡ 南向双协议栈:创建两个南向网络,分别采集IPv4和IPv6的设备。
· 仿真网络:WAN场景部署仿真组件和DTN_MANAGER组件时用于管理仿真虚拟设备和DTN服务器所使用的网络。
· 北向网络是给用户通过web页面和后端访问用的,同时也作为集群节点之间通信的网络,对带宽要求较高,要求北向网络能达到万兆带宽。
· 南向是给业务数据上报用的,是业务网络,一般不对外暴露访问,流量大,有带宽要求;采用南向主要是实现业务数据与管理网络的隔离,不相互干扰,如果采用不同网卡和不同网段,就实现了物理和网段双重隔离;
· 如果采用同一网卡不同网段,那么只实现网段隔离;如果采用相同网段且相同网卡(南北向合一),那么就完全没有隔离;根据实际业务需求进行网络模式选择。一般生产环境,管理网络和业务网络都不是同网段,管理网络都是通过堡垒机监管业务情况,所以一般都是有南向网络的,且与北向不同网段。
南北向网卡和网段配置复用说明:
· 南向网络的网卡和北向网络的网卡共用一张。
· 南向网络的网段和北向网络的网段相同。
· 在网卡和网段资源充足的情况下,我们推荐使用不同网卡和不同网段,即使用南向单协议,因为可以将南北向完全隔离,互不干扰。有双栈需求时可以选择南向双协议栈部署。
部署分析组件时,各场景网络规划:
· DC场景需要部署1个SeerCollector采集器节点,需提前规划SeerCollector采集器相关的IP地址。
· Campus场景,默认无需部署SeerCollector采集器节点,无需规划SeerCollector采集器IP地址。在需要DC场景的TCP流分析组件时,需规划采集器节点及IP地址。
· WAN场景无需部署SeerCollector采集器节点,无需规划SeerCollector采集器IP地址。
· WAN场景部署仿真组件应用且使用设备仿真时,需要规划仿真网络IP地址。
南北向网络合一(南向无网络),指分析组件数据采集共用统一数字底盘的网络,不单独创建附加网络。
单机模式下有一个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-24所示。
表2-24 分析组件网络规划-单机模式
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
1个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
||
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
集群模式下有三个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-25所示。
表2-25 分析组件网络规划-集群模式
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
3个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
南向单协议栈组网方案中,数据采集使用单独的网络,可使用IPv4或IPv6协议。
单机模式下有一个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-26所示。
表2-26 分析组件网络规划-单机模式南向单协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
1个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
||
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IP地址 |
4个(IPv4)或4个(IPv6) |
南向采集IP地址为容器附加网络地址,主动/被动采集网络分别需要2个IP地址,一个节点容器IP和一个集群虚IP地址,共4个IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
集群模式下有三个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-27所示。
表2-27 分析组件网络规划-集群模式南向单协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
3个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IP地址 |
8个(IPv4)或8个(IPv6) |
南向采集IP地址为容器附加网络地址,主动/被动采集分别需要4个IP地址,三个节点容器IP地址和一个集群虚IP地址,共8个IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
如果有SeerCollector采集器,“南向采集IP地址”和“SeerCollector采集器数据采集IP地址”两个地址需要使用相同的IP协议版本。
南向双协议组网方案中,数据采集使用单独的网络,并且需要同时配置IPv4和IPv6的地址。
单机模式下有一个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-28所示。
表2-28 分析组件网络规划-单机模式南向双协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
1个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IP地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是SeerCollector采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IP地址IPv4 |
4个(IPv4) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,主动和被动采集网络分别需要2个IP地址,一个容器IP地址和一个集群虚IP地址,共需要4个IPv4地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
网段四 |
南向采集IP地址IPv6 |
4个(IPv6) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,主动和被动采集网络分别需要2个IP地址,一个容器IP地址和一个集群虚IP地址,共需要4个IPv6地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
集群模式下有三个分析组件节点和一个SeerCollector采集器节点,分析组件的网络规划如表2-29所示。
表2-29 分析组件网络规划-集群模式南向双协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
统一数字底盘集群节点IP地址 |
3个(IPv4) |
部署统一数字底盘的主机IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
统一数字底盘北向业务虚IP地址 |
1个(IPv4) |
统一数字底盘集群对外提供服务的IP地址,部署统一数字底盘时确定 |
配置要求请参考2.1 分析组件服务器配置需求 |
|
SeerCollector采集器数据上报IP地址 |
1个(IPv4) |
SeerCollector采集器向分析组件上报采集数据使用的IP地址 |
SeerCollector采集器网卡1 |
|
网段二 |
SeerCollector采集器数据采集IPv4地址 |
2个(IPv4) |
一个用于接收网络设备镜像报文,需要与设备业务口互通 另一个是采集器浮动IP地址(仅采集器集群模式下使用),用于被设备发现 |
SeerCollector采集器网卡2,必须是独立DPDK网卡 |
网段三 |
南向采集IPv4地址 |
8个(IPv4) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,分别需要三个节点容器IP地址和一个集群虚IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
网段四 |
南向采集IPv6地址 |
8个(IPv6) |
南向采集IP地址为容器附加网络地址,分为被动采集网络和主动采集网络,分别需要三个节点容器IP地址和一个集群虚IP地址 |
配置要求请参考2.1 分析组件服务器配置需求 |
单机模式下有一个仿真分析组件节点和一个DTN_MANAGER组件节点,组件的网络规划如下表所示。
表2-30 分析组件网络规划-单机模式仿真网络单协议栈
网段 |
IP地址类型 |
IP地址个数 |
说明 |
网卡配置要求 |
网段一 |
WAN仿真分析IP地址 |
3个(IPv4) |
一个用于DTN_MANAGER组件与DTN服务器互通 另外两个用于设备仿真网络连接 |
WAN仿真分析网卡,使用设备仿真功能时必须使用独立DPDK网卡 |
分析组件部署流程汇总如表3-1所示。
步骤 |
具体操作 |
说明 |
服务器准备 |
准备1台或3台服务器用于安装统一数字底盘 |
必选 服务器配置需求请参见2.1 分析组件服务器配置需求 |
安装统一数字底盘 |
在服务器上安装统一数字底盘Matrix集群 |
必选 |
部署统一数字底盘集群和应用,部署顺序: 1. UDTP_Core 2. UDTP_GlusterFS 3. UDTP_Middle 4. BMP_Report 5. BMP_Alarm 6. BMP_Dashboard 7. BMP_Subscription 8. BMP_Template 9. BMP_Widget 10. BMP_IMonitor(可选) 11. BMP_WebSocket(可选) 12. BMP_Syslog(可选) 13. BMP_Region(可选) |
必选 |
|
配置准备 |
可选 |
|
部署分析组件 |
必选 Analyzer-Collector安装包需要在部署分析组件时安装 |
· 融合场景指在同一个统一数字底盘的集群环境中,既安装控制组件产品,又安装分析组件产品,请务必先安装控制组件,再安装分析组件。
· 园区融合场景下,一般需要同时部署统一数字底盘+vDHCP+SE+EIA+WSM+SA,由于组件众多,在单机部署时会出现微服务数量超过集群默认最大限制,此时需要调整集群对微服务数量的限制,具体调整说明请参见11.4 园区场景单机融合部署时如何调整集群最大微服务数量限制?。
· Analyzer-Collector组件应用包原包含在统一数字底盘E0711及E0711H07之前的版本发布包中,SeerAnalyzer E6313及E6313之后的版本发布包中开始包含Analyzer-Collector组件应用包。部署SeerAnalyzer E6313之前的版本时,请使用统一数字底盘E0711及E0711H07之前的版本发布包中的Analyzer-Collector组件应用包(E0711H05版本中的包名为IA-collector-E0711H05_xx,需解压为Analyzer-Collector组件应用包后使用)。部署SeerAnalyzer E6313及之后的版本时,请使用SeerAnalyzer中的Analyzer-Collector组件应用包。
使用不同的操作系统安装过程可能会存在差异,详情请参见《H3C统一数字底盘部署指导》,分析组件适配的统一数字底盘版本请参考对应的版本说明书。
需要注意的是,如需在统一数字底盘上运行分析组件,需要参照本章节的内容进行磁盘分区,并部署分析组件所需的所有应用安装包。
若需要重装某个Master节点,则需要在重装Master节点并重建之后在其他不需要重装的任意一个Master节点执行如下两个脚本:
· 进入/opt/matrix/app/install/metadata/UCENTER/collection/scripts/fault_migration,执行 sh -x faultMigration.sh $IP。
· 进入/opt/matrix/app/install/metadata/SA/scripts/fault_migration/,执行./faultMigration.sh $IP。
$IP为新建节点的管理IP,否则itoa-collect-multi容器将无限重启。
安装时请注意以下事项:
· 设置系统的日期和时间时,请根据自己的实际情况选择所需要的时区。
· 选择时区时,不允许选择“北京”,否则将会导致Core组件部署失败。
· 对于使用内置NTP服务器的场景,在部署集群之前,需确保所有节点的系统时间和当前时间保持一致。对于使用外置NTP服务器作为时钟同步源的场景,则无需修改节点的系统时间。
· 若NTP服务器不与南向地址相通,可以先不增加NTP服务器。待集群创建完成后,在配置网卡网络时,通过修改集群参数再增加。
· 集群部署完成后,请勿修改系统时间,否则可能导致集群异常。
· 主机名只能包含小写字母、数字、连字符和小数点,且不能以连字符、小数点起始或结束。
· 建立Matrix集群时,必须保证集群内各个节点的主机名互不相同,且符合主机名的命名规则,否则将会导致集群建立失败。
· Matrix集群部署完成后,请不要再对操作系统的主机名进行修改。
· 当网络列表显示多个网络时,请勿选择带<网线已拔出>标识的网卡。
· 当安装环境存在两张及以上数量网卡时,北向业务虚IP使用的网段必须和ifconfig命令查看到的第一块物理网卡的网段保持一致,否则会导致集群部署失败或Pod无法启动。
· 在网络和主机名配置页面可配置网卡,请确保在创建集群之前,完成网卡绑定的配置。
· 配置IPv4、IPv6地址时必须指定网关,否则在创建集群时可能出现问题。
· 操作系统安装完成后,建议不要使用ifconfig命令进行关闭、启动网卡的操作,否则可能导致环境异常。
· Matrix单独使用一个网口,不允许在此网口上配置子接口及子IP。
· Matrix节点其它网口的IP地址,不能和建立集群使用的IP处于同一网段。
· 设置的操作系统密码不能含有$(引用符号),\(转义符号),’(单引号),”(双引号)符号。
· 在Matrix上进行操作时,请勿在统一数字底盘上进行如下操作:
¡ 上传、删除组件安装包。
¡ 部署、升级、扩容组件。
¡ 增加、修改、删除网络。
· 若选用H3Linux2.0.x部署,南向网络的网卡如果采用bond模式时,需要按如下方式修改网卡bond配置,否则影响采集组件使用。
a. 使用有管理员权限登录服务器后台,将配置文件/etc/sysconfig/network-scripts/ifcfg-xxx(bond网卡名称)中的IPV6_AUTOCONF配置为no:
图4-1 配置修改
b. 修改完成后,在后台执行命令nmcli c reload && nmcli c up xxx(bond网卡名称)。
· 修改节点时间的注意事项如下:
¡ 修改所有导入至SeerAnalyzer的设备的时区,需要与SeerAnalyzer服务器的时区保持一致。
¡ 修改SeerCollector采集器的时区,需要与SeerAnalyzer服务器的时区保持一致。
· 为GlusterFS应用准备的磁盘不能被格式化,否则会安装失败。若该磁盘被格式化,则可通过“wipefs -a /dev/磁盘名称”命令清空磁盘来进行修复。
· 如需使用HTTPS协议,请在应用和组件安装完成后,登录统一数字底盘,点击[系统>系统配置>安全配置]菜单项,进入安全配置页面,启用HTTPS协议。
· 在部署SeerAnalyzer和SeerCollector前,请在各节点执行cat /proc/sys/vm/nr_hugepages命令检查大页是否开启,如果返回结果不是0,请记录该值,并执行echo 0 > /proc/sys/vm/nr_hugepages命令临时关闭大页。待部署SeerAnalyzer和SeerCollector完成后,再将echo 0 > /proc/sys/vm/nr_hugepages命令中的数字0改为记录的值,并在各节点执行,以恢复大页配置。
根据不同的业务量和不同的服务器配置需求进行了不同的磁盘RAID和分区规划。实际分区过程中,分区名称不需要与表格中的分区名称完全一致。
· 部分分区有特殊要求,请根据备注进行配置。
· 分析组件部署完成以后,不支持动态扩展硬盘,需要提前准备好硬盘,再安装部署。
· 分析组件数据盘必须要规划3个分区在“/sa_data”、“/sa_data/mpp_data”、“/sa_data/kafka_data”这3个挂载点上,同时文件系统类型必须配置为ext4类型,否则会部署失败。若按照4.2.2 数据盘RAID和分区规划推荐的分区规划进行数据盘分区但未修改文件系统类型的情况下,可参考11.13 如何将数据盘分区的文件系统类型修改为ext4类型?修改文件系统类型。
· 数据盘必须使用独立的磁盘。
· 系统盘空间充足时,/var/lib/docker,/var/lib/ssdata,以及GlusterFS分区推荐挂载到系统盘。如系统盘空间不足,数据盘磁盘充足,这三个分区可以挂载到数据盘中(需要在数据盘额外分区进行挂载)。
· 为GlusterFS预留500GB是部署统一数字底盘和分析组件需要的容量,如果还需部署其它组件,需要各组件确定占用的磁盘容量大小,并在此基础上扩容。
· 园区Cloudnet组件业务数据存储在/var/lib/ssdata路径下,故园区场景系统盘空间在表4-1基础上有所增加。在线用户10000及以下,/var/lib/ssdata需要增加500G容量,在线用户10000以上,/var/lib/ssdata需要增加1T容量。即在线用户10000及以下时,系统盘需2*2.4TB(RAID1),在线用户10000以上,系统盘需2*3TB(RAID1)。
· /opt/matrix/app/data/base-service/backupRecovery:业务备份数据存放使用,该分区的容量和各组件的业务备份数据大小有关,需要各组件确定占用的磁盘容量大小,在此基础上扩缩容。
系统盘主要用于存储操作系统和统一数字底盘的相关数据。统一数字底盘对系统盘大小有要求,需要配置RAID,RAID模式可选RAID1、RAID5、RAID10。在磁盘条件满足的情况下,分区规划请参见表4-1。
表4-1 磁盘RAID和分区规划
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
备注 |
1920GB |
/dev/sda1 |
/boot/efi |
200MB |
EFI System Partition类型,仅UEFI模式需要配置该分区 |
/dev/sda2 |
/boot |
1024MB |
- |
|
/dev/sda3 |
/ |
400GB |
磁盘空间充足时,可适当扩容,业务数据不建议放在根目录 |
|
/dev/sda4 |
/var/lib/docker |
400GB |
磁盘空间充足时,可适当扩容 |
|
/dev/sda6 |
swap |
4GB |
swap类型 |
|
/dev/sda7 |
/var/lib/ssdata |
450GB |
磁盘空间充足时,可适当扩容 |
|
/dev/sda8 |
无 |
500GB |
为GlusterFS预留,安装操作系统时无需配置 |
|
/dev/sda9 |
/opt/matrix/app/data/base-service/backupRecovery |
50GB |
(可选)业务备份数据存放分区 不创建此分区时,业务备份数据存放于根分区下 创建此分区时,业务备份数据存放于此分区下 如创建此分区,此分区使用的磁盘空间需要从根分区划出。例如,此分区的大小设置为50GB时,根分区大小需要从400GB调整为350GB 由于各业务场景需求不同,需要根据实际情况划分大小 |
|
50GB |
/dev/sdb |
/var/lib/etcd |
50GB |
ETCD分区可与其他分区共用物理硬盘,从性能角度考虑,推荐ETCD分区占用独立的物理硬盘 |
数据盘主要用于存储分析组件的业务数据和Kafka数据。不同网络规模下,业务数据量不同,对磁盘数量及容量的配置要求不同。数据盘不多于2块时,做RAID0(风险较大,不推荐);数据盘3块及以上时,可以做RAID5,可以满足下表容量要求的情况下,建议做RAID5。
现场实施环境不建议数据盘做RAID0,数据安全风险很大。
表4-2 Campus场景数据盘分区规划1
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
2TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
950GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
450GB |
ext4类型 |
表4-3 Campus场景数据盘分区规划2
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
3TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
1550GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
750GB |
ext4类型 |
表4-4 Campus场景数据盘分区规划3
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
4TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
2200GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
1000GB |
ext4类型 |
表4-5 Campus场景数据盘分区规划4
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
5TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
2800GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
1300GB |
ext4类型 |
表4-6 Campus场景数据盘分区规划5
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
7TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
4000GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
1900GB |
ext4类型 |
表4-7 Campus场景数据盘分区规划6
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
8TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
4600GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
2200GB |
ext4类型 |
表4-8 Campus场景数据盘分区规划7
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
11TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
6400GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
3100GB |
ext4类型 |
表4-9 DC场景数据盘分区规划1
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
8TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
4600GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
2200GB |
ext4类型 |
表4-10 DC场景数据盘分区规划2
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
12TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
7000GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
3400GB |
ext4类型 |
表4-11 DC场景数据盘分区规划3
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
24TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
14200GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
7000GB |
ext4类型 |
表4-12 WAN场景数据盘分区规划1
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
2TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
950GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
450GB |
ext4类型 |
表4-13 WAN场景数据盘分区规划2
磁盘RAID后容量 |
分区名称 |
挂载点 |
推荐最小容量 |
文件系统类型 |
4TB |
/dev/sdc1 |
/sa_data |
400GB |
ext4类型 |
/dev/sdc2 |
/sa_data/mpp_data |
2200GB |
ext4类型 |
|
/dev/sdc3 |
/sa_data/kafka_data |
1000GB |
ext4类型 |
部署分析组件所需的3个数据盘分区随操作系统部署时进行创建,其具体创建过程请参考《H3C统一数字底盘部署指导》中的“安装H3Linux操作系统及Installer平台”章节。如果在部署操作系统时未创建对应的数据盘分区,可在底盘部署完成之后进行手动创建。
根据4.2.2 数据盘RAID和分区规划规划的分区大小,在每个要部署分析组件的节点上确认数据盘剩余空间大小是否满足要求。
(1) 确认各节点磁盘剩余空间满足要求以后,通过fdisk命令,创建磁盘分区。
如下图所示,以在sdb磁盘上创建一个400GB空间的分区为例进行说明。
图4-2 创建磁盘分区
若出现“重新读取分区表失败”的提示,使用reboot命令重启节点即可。
如下图所示,在sdb磁盘中创建了一个400GB的空闲磁盘分区/dev/sdb1。
图4-3 查看当前磁盘分区信息
(2) 当使用fdisk命令发生如图4-4所示的报错,需要使用如图4-5所示的命令对数据盘进行处理。
图4-4 fdisk命令发生报错
(3) 按照上述操作,在需要部署分析组件的每个节点上创建3个分区,分区大小参考4.2.2 数据盘RAID和分区规划。
(1) 使用指令mkfs.ext4 /dev/sdb1格式化分区(非ext4的数据盘分区都要执行,上一节创建的分区,默认格式为xfs)。
(2) 使用指令获取新的UUID,过滤条件为对应的磁盘分区,用‘|’隔开。(这里以创建的三个分区分别为sdb1,sdb2,sdb3为例)。
[root@sa1 ~]# ll /dev/disk/by-uuid | grep -E 'sdb1|sdb2|sdb3'
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 -> ../../sdb1
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 c9da5aba-80b9-4202-ba16-b222462a0329 -> ../../sdb3
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 cac87013-f014-40df-9aca-af76888b1823 -> ../../sdb2
(3) 使用vim /etc/fstab命令替换新的UUID以及修改分区格式类型为ext4。
(4) 查看修改后的文件。
[root@ sa1 ~]# cat /etc/fstab
#
# /etc/fstab
# Created by anaconda on Wed Dec 7 15:44:15 2022
#
# Accessible filesystems, by reference, are maintained under '/dev/disk‘
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=519f9af7-12ce-4567-b62c-2315cad14f56 / xfs defaults 0 0
UUID=83628a24-94f5-4937-b016-64d0f72bd98d /boot xfs defaults 0 0
UUID=3B96-1B3A /boot/efi vfat defaults,uid=0,gid=0,umask=0077,shortname=winnt 0 0
UUID=89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 /sa_data ext4 defaults 0 0
UUID=c9da5aba-80b9-4202-ba16-b222462a0329 /sa_data/kafka_data ext4 defaults 0 0
UUID=cac87013-f014-40df-9aca-af76888b1823 /sa_data/mpp_data ext4 defaults 0 0
UUID=51987141-f160-4886-ad51-bc788ec2176c /var/lib/docker xfs defaults 0 0
UUID=4e91a1b8-4890-4a41-be00-098ded6b8102 /var/lib/etcd xfs defaults 0 0
UUID=2554963b-03e7-4be4-b214-7350f2eb3df9 /var/lib/ssdata xfs defaults 0 0
#UUID=a22041b8-7c7c-4730-bc1f-634306145e36 swap swap defaults 0 0
(5) 执行mount -a进行挂载。
出现下报错为正常现象:
mount: 挂载点 /sa_data/kafka_data 不存在
mount: 挂载点 /sa_data/mpp_data 不存在
(6) 创建不存在的目录。
[root@ sa1 ~]# mkdir -p /sa_data/kafka_data
[root@ sa1 ~]# mkdir -p /sa_data/mpp_data
(7) 再次执行mount -a进行挂载即可完成文件系统类型的修改。
(8) 在每一个部署分析组件的节点上执行上述操作。
部署统一数字底盘时,请上传如表4-14所示的应用安装包,具体安装步骤请参见《H3C统一数字底盘部署指导》。
必选应用包必须在部署统一数字底盘时完成部署。部署步骤请参考《H3C统一数字底盘部署指导》中的“部署统一数字底盘应用安装包”章节。
如需部署可选应用包,可选择在部署完分析组件后在Matrix页面部署可选包,也可在部署分析组件前在Matrix页面部署可选包。需要注意的是,请确保可选应用包的版本与必选应用包的版本相同,否则可能导致部署失败。部署步骤请参考《H3C统一数字底盘部署指导》中的“部署统一数字底盘应用安装包”章节。
安装包的名称格式如下表所示,其中version为版本号。
安装包名称 |
功能说明 |
依赖关系 |
· x86:UDTP_Core_version_x86.zip · ARM:UDTP_Core_version_arm.zip |
门户、统一认证、用户管理、服务网关、帮助中心、权限、资源身份、License、配置中心、资源组、日志服务 |
Middle、GlusterFS |
· x86:UDTP_GlusterFS_version_x86.zip · ARM:UDTP_GlusterFS_version_arm.zip |
提供产品内本地共享存储功能 |
Middle |
· x86:UDTP_Middle_version_x86.zip · ARM:UDTP_Middle_version_arm.zip |
中间件镜像库 |
- |
· x86:BMP_IMonitor_version_x86.zip · ARM:BMP_IMonitor_version_arm.zip |
提供自监控服务 |
Middle、GlusterFS、Core |
· x86:BMP_Alarm_version_x86.zip · ARM:BMP_Alarm_version_arm.zip |
提供告警服务 |
Report |
· x86:BMP_Dashboard_version_x86.zip · ARM:BMP_Dashboard_version_arm.zip |
大屏框架 |
大屏应用需要同时安装Dashboard和widget安装包,且先安装Dashboard,再安装widget |
· x86:BMP_Report_version_x86.zip · ARM:BMP_Report_version_arm.zip |
报表 |
- |
· x86:BMP_Subscription_version_x86.zip · ARM:BMP_Subscription_version_arm.zip |
订阅服务 |
Report、Alarm |
· x86:BMP_Template_version_x86.zip · ARM:BMP_Template_version_arm.zip |
访问参数模板、监控模板 |
- |
· x86:BMP_Widget_version_x86.zip · ARM:BMP_Widget_version_arm.zip |
平台大屏Widget |
· Dashboard · 大屏应用需要同时安装Dashboard和widget安装包,且先安装Dashboard,再安装widget |
· x86:BMP_WebSocket_version_x86.zip · ARM:BMP_WebSocket_version_arm.zip |
(可选)南向Websocket功能 |
- |
· x86:BMP_Syslog_version_x86.zip · ARM:BMP_Syslog_version_arm.zip |
(可选)Syslog相关功能 |
Report、Alarm |
· x86:BMP_Region_version_x86.zip · ARM:BMP_Region_version_arm.zip |
(可选)上下级分级管理功能 |
如需发送告警,还需安装Report、Alarm |
统一数字底盘不在分析组件发布的版本中,请自行下载。
建议不要使用ifconfig命令进行关闭、启动网卡的操作,可能导致环境异常。
若有使用多块网卡的需求,需在服务器上启用网卡。启用网卡的配置步骤如下:
(1) 远程登录统一数字底盘所在服务器,在服务器上修改网卡配置文件。此处以修改网卡ethA09-2的网卡配置文件为例。
(2) 使用以下命令打开并编辑网卡文件。
[root@matrix01 /]# vi /etc/sysconfig/network-scripts/ifcfg-ethA09-2
(3) 将网卡配置文件中的BOOTPROTO和ONBOOT修改为如下图所示。BOOTPROTO配置为none表示不指定网卡的启动协议,ONBOOT配置为yes表示开机自动启用网卡连接。
图5-1 编辑网卡文件
(4) 新增网卡配置:NOZEROCONF=yes。
图5-2 编辑网卡文件
(5) 使用以下命令ifdown和ifup命令重启网卡。
[root@matrix01 /]# ifdown ethA09-2
[root@matrix01 /]# ifup ethA09-2
(6) 使用ifconfig命令查看网络信息。若网卡状态为UP则表示网卡启用成功。
部分分析组件版本发布x86版本或ARM版本中的一种安装包,具体请以版本发布文件为准。
安装包的名称格式如下表所示,其中version为版本号。
表5-1 组件应用包列表
产品名称 |
安装包名称 |
功能说明 |
分析组件 |
· x86:Analyzer-Platform-verison_x86_64.zip · ARM:Analyzer-Platform-verison_arm.zip |
基础平台组件应用包 |
· x86:Analyzer-Telemetry-verison_x86_64.zip · ARM:Analyzer-Telemetry-verison_arm.zip |
指标分析组件应用包 |
|
· x86:Analyzer-AI-verison_x86_64.zip · ARM:Analyzer-AI-verison-verison_arm.zip |
AI智能预测组件应用包 |
|
· x86:Analyzer-Diagnosis-verison_x86_64.zip · ARM:Analyzer-Diagnosis-verison_arm.zip |
诊断分析组件应用包 |
|
· x86:Analyzer-SLA-verison_x86_64.zip · ARM:Analyzer-SLA-verison_arm.zip |
服务质量分析组件应用包 |
|
· x86:Analyzer-TCP-verison_x86_64.zip · ARM:Analyzer-TCP-verison_arm.zip |
TCP流分析组件应用包 |
|
· x86:Analyzer-WAN-verison_x86_64.zip · ARM:Analyzer-WAN-verison_arm.zip |
WAN应用分析组件应用包 |
|
· x86:DTN_MANAGER-verison_x86_64.zip |
DTN主机管理组件应用包 |
|
· x86:Analyzer-Simulation-verison_x86_64.zip · ARM:Analyzer-Simulation-verison_arm.zip |
WAN网络仿真组件应用包 |
|
· x86:Analyzer-User-verison_x86_64.zip · ARM:Analyzer-User-verison_arm.zip |
用户分析组件应用包 |
|
· x86:Analyzer-AV-verison_x86_64.zip · ARM:Analyzer-AV-verison_arm.zip |
音视频分析组件应用包 |
|
· x86:Analyzer-Collector-verison_x86_64.zip · ARM:Analyzer-Collector-verison_arm.zip |
Analyzer-Collector安装包需要在部署分析组件时安装 |
|
Cloudnet |
· Cloudnet E6214之前的版本: ¡ x86:oasis-verison.zip ¡ ARM:oasis-verison-arm.zip · Cloudnet E6214及之后的版本: ¡ x86:Campus_Cloudnet_verison_x86.zip ¡ ARM:oasis-verison-arm.zip |
Cloudnet组件应用包(Campus场景必选) |
分析组件:
分析组件发布版本包:SEERANALYZER-verison.zip,verison为版本号。解压之后才能看到具体的安装包。
采集组件说明:
· COLLECTOR采集器: COLLECTOR采集器为公共采集组件。
· SeerCollector采集器: SeerCollector采集器在使用分析组件的TCP流分析、INT流分析功能时需要部署。
若已安装操作系统且未安装分析组件的情况下,重建过节点,则需要在分析组件所在的各节点执行如下命令清理known_hosts中记录的各节点主机公钥信息。
· 如果安装用户为admin或root,需要执行如下命令:
rm -rf /root/.ssh/known_hosts
rm -rf /home/admin/.ssh/known_hosts
· 如果安装用户不是admin或root,需要执行如下命令,以sa_install用户为例:
rm -rf /home/sa_install/.ssh/known_hosts
· 在部署分析组件时,使用不同版本的统一数字底盘,配置过程会略有差异,具体配置操作可参考对应版本的统一数字底盘部署指导手册中“部署组件”章节。
· 分析组件可按需部署对应场景,在分析组件部署完成后,不可追加部署其他场景,需要卸载分析组件后重新部署。
· 分析组件部署后不支持修改Matrix节点和集群IP地址。
· 分析组件部署后不支持修改主机名,详情可参见统一数字底盘安装部署手册。
· 在部署分析组件时修改Matrix节点和集群IP地址,需要提前在[分析选项>任务管理]页面下将所有解析任务停用再修改,否则容易引发修改失败。
· 如何部署DTN主机,以及在分析组件上构建仿真网络请参见《H3C SeerAnalyzer-WAN仿真网络操作指导》。
· WAN仿真分析组件只能通过Matrix融合部署页面进行安装和部署。
· 分析组件(E63xx及以上版本),由于统一数字底盘E06xx版本WebSocket不支持多组件共同使用,请避免和控制组件融合部署在统一数字底盘E06xx上,以免影响功能使用。
· WAN仿真分析组件E6502版本不支持在统一数字底盘E0713之前的版本上部署。
登录统一数字底盘,单击“系统”页签,在左侧导航树中选择“部署管理”菜单项,未部署任何组件时,默认进入上传安装包页面,如图5-3所示。
单击<上传>按钮,将分析组件、Analyzer-Collector公共采集组件安装包及Cloudnet组件安装包(Campus场景必选)上传到系统。上传完成后,单击<下一步>按钮,解析安装包并进入组件选择页面。
· 在安装统一数字底盘的时候也可以先上传对应所需的组件。
· 在WAN场景中,分析组件不支持独立部署,仅支持控制组件和分析组件融合部署,并且需要优先安装控制组件。
分析组件目前分为多个组件应用包,用户可按实际需要选择性上传,组件应用包与业务场景的关系如表5-2所示。
组件 |
说明 |
Campus |
WAN承载 |
WAN分支 |
DC |
Analyzer-Platform |
公共基础组件 |
必选 |
必选 |
必选 |
必选 |
Analyzer-Collector |
公共采集组件 |
必选 |
必选 |
必选 |
必选 |
Analyzer-Telemetry |
指标分析 |
必选 |
必选 |
必选 |
必选 |
Analyzer-WAN |
WAN应用分析 |
可选,默认不需要 |
必选 |
必选 |
可选 |
Analyzer- Simulation |
WAN网络仿真分析 |
不可选 |
可选 |
不可选 |
不可选 |
DTN_Manager |
WAN DTN主机管理 |
不可选 |
可选(须配合Analyzer -Simulation) |
不可选 |
不可选 |
Analyzer-User |
用户分析 |
必选 |
不可选 |
不可选 |
不可选 |
Analyzer-AV |
音视频分析 |
可选 |
可选 |
可选 |
不可选 |
Analyzer-SLA |
服务质量分析 |
可选 |
必选 |
不可选 |
必选(须配合SeerCollecter采集器) |
Analyzer-TCP |
TCP流分析 |
可选(须配合SeerCollecter采集器),默认不需要 |
不可选 |
不可选 |
必选(须配合SeerCollecter采集器) |
Analyzer-Diagnosis |
诊断分析 |
必选 |
必选 |
必选 |
必选 |
Analyzer-AI |
AI智能预测 |
必选 |
必选 |
必选 |
必选 |
· Platform为公共基础组件,是必选安装包,其它组件根据实际业务场景需求进行选装。
· Telemetry组件是WAN/User/AV/SLA/TCP/Diagnosis/AI组件的基础,当安装这些组件时,Telemetry组件必装。
· DTN_MANAGER组件是WAN承载场景网络仿真中使用设备仿真功能的基础,当使用WAN仿真中的设备仿真,DTN_MANAGER组件必装。
· 组件选择说明中:“必选”表示对应场景必须安装该组件,否则分析组件无法正常工作;“可选”表示除非明确需要该组件的功能,对应场景下一般不安装该组件;“不可选”表示对应场景下该组件无法正常工作。
· 当DC场景支持Netstream/sFlow时,需安装Analyzer-WAN组件
如果没有部署SeerCollecter采集器,需要取消TCP流分析(Analyzer-TCP组件)的勾选。
(1) 在组件选择页面展开“分析组件”菜单项,勾选“分析组件(6.0)”,并根据上节所述选择需要安装的组件应用包。
¡ 选择部署的场景,支持Campus、DC、WAN场景,分别用于园区、数据中心、广域网场景。
图5-4 Campus场景默认勾选的组件信息1
图5-5 Campus场景默认勾选的组件信息2
Campus场景默认只需要部署如下组件:Platform,Telemetry,Diagnosis,AI,User。
图5-6 DC场景默认勾选的组件信息1
图5-7 DC场景默认勾选的组件信息2
图5-8 WAN场景默认勾选的组件信息1
图5-9 WAN场景默认勾选的组件信息2
(2) (Campus场景必选)展开“公共服务”菜单项,请选择对应的Cloudnet安装包。
(3) 展开“公共服务”菜单项,勾选COLLECTOR,用于提供gRPC、netconf协议的数据采集任务。选择对应的Analyzer-Collector安装包,并根据网络规划,选择对应的网络方案,网络规划介绍请参见2.6 分析组件网络规划。本文档中以选择“南向单协议栈”为例。
由于不同版本统一数字底盘有差异,“南北向网络合一”网络规划方案在旧的版本里名为“南向无网络”,其实际为同一个规划方案。
(4) 完成后单击<下一步>按钮,进入参数配置页面。
· 公共服务中,如果一开始没有安装Cloudnet组件,后续仍可选择“分析组件(6.0)”选项,然后选择Cloudnet组件进行安装。对于已经安装的组件,统一数字底盘不会重新安装。
· 公共服务中的COLLECTOR组件必须安装,否则分析组件功能不能正常使用。
在参数配置页面,无需进行参数配置,直接单击<下一步>按钮,进入网络配置页面。
· 网络配置功能仅用于采集组件,COLLECTOR采集组件运行在Master节点,所以网络配置需要绑定Master节点,与分析组件部署在哪些指定的节点上无关(如3+1、3+3等部署模式)。
· 若选用麒麟操作系统作为操作系统的话,网卡bond必须配置IP,否则bond的网卡不可用。
本页面用于配置COLLECTOR采集组件的南向采集IP地址。根据在组件选择页面选择的网络方案确定:
· “南北向网络合一”(南向无网络)方案:无需配置网络,直接进行下一步。如前文所述,在条件允许的情况下,我们推荐南北向网络隔离,即使用“南向单协议”或者“南向双协议”方案,不推荐使用“南北向网络合一”方案。
· “南向单协议”方案:在本页面创建一个IPv4或IPv6网络。
· “南向双协议”方案:在本页面创建一个IPv4和一个IPv6网络。
本文档以选择“南向单协议”方案,南向配置IPv4网络为例。配置完成后,单击<下一步>按钮,进入节点绑定页面。
在节点绑定页面,为分析组件指定部署节点。集群模式在该页面,可选择“开启节点标签”功能,开启节点标签后可选择部署分析组件的节点名称,推荐开启该功能。配置完成后,单击<下一步>按钮,进入参数确认页面。
节点标签功能可将部分Pod绑定到指定的物理节点,解决在融合部署场景节点资源不足的情况下,分析组件抢占其他组件资源的问题:
· 单机模式下没有节点标签功能,分析组件将部署在唯一的单机节点上。
· 集群模式下,若开启该功能,可指定分析组件在集群中部署的节点名称,支持选择集群中的任意节点,要求选择的节点数可以是1个,或者3个及以上;若不开启节点标签,分析组件将默认部署在集群中的所有节点上。
· 可指定四类Pod:Service Nodes、Kafka Nodes、MPP Nodes、ES Nodes。即可以指定4种类型Pod的实际运行物理节点。Service Nodes指的是业务所属Pod需要指定的运行节点,Kafka Nodes指的是Kafka所属Pod需要指定的运行节点,ES Nodes指的是ES所属Pod需要指定的运行节点,MPP Nodes指的是Vertica所属Pod需要指定的运行节点。
· 3+1部署模式:统一数字底盘和控制组件部署在3个Master节点上,分析组件部署在1个Worker节点上,部署时节点标签勾选1个Worker节点。
· 3+3部署模式:统一数字底盘和控制组件部署在3个Master节点上,分析组件部署在3个Worker节点上,部署时节点标签勾选3个Worker节点。
· 3+N(N≥0)模式:分析组件部署对节点的角色(Master、Worker)没有要求,可以部署在任意角色的节点上。
图5-13 节点绑定
在网络绑定页面,可为COLLECTOR采集器绑定南向网络。
网络绑定原则:
· 南北向网络合一(南向无网络)方案无需配置资源绑定。
· 南向单协议栈方案中需要将网络指定为管理网络。
· 南向双协议栈方案中,需要将IPv4网络指定为管理网络,将IPv6网络指定为默认网络。
在参数确认页面确认IP地址分配结果后,单击<部署>按钮,部署组件。
部署完成后,在组件管理页面可以查看组件的详细信息。
登录Matrix页面,单击“部署”页签,在左侧导航树中选择“融合部署”菜单项,未部署任何分析组件时,如图5-15所示。
(1) 单击<安装>按钮,进入组件上传页面。再次单击<上传>按钮,弹出安装包选择界面,如图5-16所示。
(2) 单击<选择文件>按钮,选中分析组件、Analyzer-Collector公共采集组件安装包、Cloudnet组件安装包(Campus场景必选),然后单击<上传>按钮上传到系统。上传完成后,单击<下一步>按钮,解析安装包并进入应用选择页面。
· 在安装统一数字底盘的时候也可以先上传对应所需的组件。
· 在WAN场景中,分析组件不支持独立部署,仅支持控制组件和分析组件融合部署,并且需要优先安装控制组件。
分析组件目前分为多个组件应用包,用户可按实际需要选择性上传,组件应用包与业务场景的关系如下表所示。
组件 |
说明 |
Campus |
WAN承载 |
WAN分支 |
DC |
Analyzer-Platform |
公共基础组件 |
必选 |
必选 |
必选 |
必选 |
Analyzer-Collector |
公共采集组件 |
必选 |
必选 |
必选 |
必选 |
Analyzer-Telemetry |
指标分析 |
必选 |
必选 |
必选 |
必选 |
Analyzer-WAN |
WAN应用分析 |
可选,默认不需要 |
必选 |
必选 |
可选 |
Analyzer-Simulation |
WAN网络仿真分析 |
不可选 |
可选 |
不可选 |
不可选 |
DTN_Manager |
WAN DTN主机管理 |
不可选 |
可选(须配合Analyzer- Simlation) |
不可选 |
不可选 |
Analyzer-User |
用户分析 |
必选 |
不可选 |
不可选 |
不可选 |
Analyzer-AV |
音视频分析 |
可选 |
可选 |
可选 |
不可选 |
Analyzer-SLA |
服务质量分析 |
可选 |
必选 |
不可选 |
必选(须配合SeerCollecter采集器) |
Analyzer-TCP |
TCP流分析 |
可选(须配合SeerCollecter采集器),默认不需要 |
不可选 |
不可选 |
必选(须配合SeerCollecter采集器) |
Analyzer-Diagnosis |
诊断分析 |
必选 |
必选 |
必选 |
必选 |
Analyzer-AI |
AI智能预测 |
必选 |
必选 |
必选 |
必选 |
· Platform为公共基础组件,是必选安装包,其它组件根据实际业务场景需求进行选装。
· Telemetry组件是WAN/User/AV/SLA/TCP/Diagnosis/AI组件的基础,当安装这些组件时,Telemetry组件必装。
· DTN_MANAGER组件是WAN承载网络仿真中使用设备仿真功能的基础,当使用WAN仿真中的设备仿真,DTN_MANAGER组件必装。
· 在配置仿真组件参数时,若“设备仿真”选择“是”,则仿真组件和DTN_MANAGER组件需要绑定仿真网络,否则设备仿真功能不可用。
· 组件选择说明中:“必选”表示对应场景必须安装该组件,否则分析组件无法正常工作;“可选”表示除非明确需要该组件的功能,对应场景下一般不安装该组件;“不可选”表示对应场景下该组件无法正常工作。
· 当DC场景支持Netstream/sFlow时,需安装Analyzer-WAN组件
· 如果没有部署SeerCollecter采集器,需要取消TCP流分析(Analyzer-TCP组件)的勾选。
· Campus场景下需要安装Cloudnet组件,当前在“融合部署”页面下不支持安装该组件,需要在[部署>应用]页面下进行安装。
(1) 在应用选择页面下拉找到分析组件应用组所在区域,并根据上节所述选择需要安装的组件应用包,如下图所示。
图5-17 应用选择页面
选择应用时,应根据要部署的场景(Campus、DC、WAN)及表5-3中的对应关系合理选择。
· Campus场景默认只需要部署如下组件:Platform、Collector、Telemetry、Diagnosis、AI、User。
· DC场景默认只需要部署如下组件:Platform、Collector、Telemetry、Diagnosis、TCP、WAN、AI、SLA。
· WAN承载场景默认只需要部署如下组件:Platform、Collector、Telemetry、Diagnosis、WAN、AI、SLA。
· WAN分支场景默认只需要部署如下组件:Platform、Collector、Telemetry、Diagnosis、WAN、AI。
(2) 在应用选择页面找到“公共服务”应用组所在区域,勾选采集组件。如下图所示。
该组件用于提供gRPC、netconf协议的数据采集任务。
图5-18 应用选择页面
分析组件和采集组件选择完成后,单击<下一步>按钮,进入安装包选择页面。如下图所示。
如果环境上同一组件存在多个版本的安装包,可在该页面进行下拉选择指定版本的安装包。
图5-19 安装包选择页面
Collector,Platform,Analyzer-WAN-Simulation,DTN_MANAGER和ai-analysis组件支持参数配置,其余组件均不需要进行参数配置。
(1) 在安装包选择页面,完成安装包的选择之后,单击<下一步>按钮,进入参数配置页面。
各组件有对应的参数配置页签,如下图所示。
图5-20 参数配置页面
(2) 采集组件参数配置
采集组件的参数配置页面如下图所示。
图5-21 参数配置页面
a. 节点绑定
单机模式:采集组件不支持节点绑定,默认部署在Master节点。
集群模式:采集组件支持任选Master或者Worker中的一个或三个节点部署,不启用节点绑定默认部署在Master节点。
分析组件与控制组件分离部署,采集组件推荐部署在Master节点。
分析组件与控制组件融合部署,采集组件推荐部署在Worker节点,推荐网络方案为南向网络(需要独占Worker节点一个网口,用于承载南向网络),如果网络方案为南北向合一,部分采集程序由于依赖集群北向虚IP仍然会在Master节点运行。
b. 网络配置
c. 网络绑定
该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
Analyzer-Simulation组件的参数配置页面如下图所示。
图5-22 参数配置页面
a. 节点绑定
仿真分析组件支持任选Master中的一个节点部署。
b. 网络配置
c. 网络绑定
若“设备仿真”配置为“是”则可与仿真设备建立连接关系,且需要绑定仿真网络;若配置为“否”,则无需绑定仿真网络。
该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
(4) DTN-Manager组件参数配置
若仿真组件将“设备仿真”配置为“是”,则需继续配置DTN-Manager组件的参数。
a. 节点绑定:建议与仿真分析组件绑定在同一个节点上。
b. 网络配置:网络配置可参考(3)仿真组件参数配置的网络配置步骤。
c. 网络绑定:建议与仿真分析组件绑定在同一个网络上。
该页签下所有参数配置完成后,即可保存配置。
图5-23 DTN-Manager组件参数配置页面
(5) 分析平台组件参数配置
分析平台组件参数配置页面如下图所示。
图5-24 分析平台参数配置页面
a. 数据库配置
该配置用于指定分析组件是否安装业务数据库以及数据库的安装类型,默认模式为安装业务数据库。数据库类型保持默认即可,配置页面会根据当前产品类型和环境情况自动切换默认值。
b. 场景配置
根据实际安装场景进行选择即可。
c. 节点配置
该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
(6) AI预测分析参数配置
AI预测分析组件参数配置页面如下图所示。
图5-25 AI预测分析参数配置页面
a. 负载配置
该配置用于指定AI预测任务负载容器数量,默认为“负载节点数量*2”,例如该配置下方的节点配置如果绑定了3个节点,将会创建6个负载容器执行AI预测任务。也可以选择“自定义”单选框,填写具体的数值,创建指定数量的负载容器。推荐使用默认配置。
b. 节点配置
该配置为AI预测负载容器指定部署节点,默认关闭。集群模式下可选择打开“节点绑定”功能。开启节点绑定后可选择部署AI预测任务负载容器的节点名称,在不开启节点绑定功能的情况下,将使用分析平台配置页面配置的节点信息。
该页签下的所有参数配置完成后,单击<应用>按钮,即可保存配置。
在各组件的参数配置页面配置完参数并点击<应用>按钮以后,单击<部署>按钮,部署组件。
部署完成后,在组件管理页面可以查看组件的详细信息。
SeerAnalyzer部署完成后将在统一数字底盘中加载对应菜单项,登录统一数字底盘即可使用SeerAnalyzer功能。
统一数字底盘提供友好的GUI界面。具体登录方式如下:
(1) 在浏览器中输入统一数字底盘登录地址(默认登录地址:http://ip_address:30000/central/index.html),回车后会进入如图6-1所示登录界面。
¡ ip_address:为统一数字底盘所在的集群北向业务虚IP地址。
¡ 30000为端口号。
(2) 输入用户名密码登录统一数字底盘,缺省用户名为admin,密码为Pwd@12345。登录成功后进入主页面。
统一数字底盘的注册步骤请参见《H3C统一数字底盘部署指导》。
分析组件安装完成后,可90天内试用所有功能,超过试用期限后,需要获取License授权才能正常使用。
关于授权的申请和安装过程,请参见《H3C软件产品远程授权License使用指南》。
(1) 登录统一数字底盘,依次单击[系统>License管理>License信息]菜单项,进入License信息页面。
(2) 在页面中配置License Server信息的参数,详细介绍请参见表7-1。
参数 |
说明 |
IP地址 |
安装License Server的服务器上用于统一数字底盘和分析组件集群内各节点之间通信的IP地址 |
端口号 |
此处缺省值为“5555”,与License Server授权服务端口号保持一致 |
用户名 |
License Server中设置的客户端名称 |
密码 |
License Server中设置的客户端名称对应的密码 |
(3) 配置完成后,单击<连接>按钮与License Server建立连接,连接成功后统一数字底盘和分析组件可自动获取授权信息。
(1) 如果是参照5.2.1 部署分析组件(统一数字底盘E0713之前版本)安装的分析组件,请登录统一数字底盘,登录地址:http://ip_address:30000/central。如果是参照5.2.2 部署分析组件(统一数字底盘E0713及之后版本)安装的分析组件,请登录Matrix页面,登录地址:https://ip_address:8443/matrix/ui。其中ip_address为统一数字底盘的北向业务虚IP,默认用户名为admin,密码为Pwd@12345。
(2) 在统一数字底盘页面需单击[部署>融合部署]菜单项,进入组件部署导航页面。在Matrix页面需单击[系统>部署管理]菜单项,进入组件部署导航页面。
(3) 勾选“分析组件”,单击左上角<卸载>按钮,完成组件卸载。
(4) (本步骤为非必选操作)登录SeerCollector采集器所在服务器,进入/usr/local/itoaAgent目录,执行bash uninstall.sh命令手动清除数据。(如果是非root用户,请执行sudo bash uninstall.sh)然后使用ps -aux | grep agent | grep -v grep命令检查,命令执行后无输出则证明卸载干净。
图8-1 清除数据
在统一数字底盘上支持对组件进行保留配置升级。升级组件可能会导致分析数据中断或不完整,请谨慎操作。
· 若使用Vertica数据库版本,在升级前需通过以下命令检查数据库状态,当“State”列存在非UP状态时,请终止升级并联系H3C工程师处理:
su - dbadmin -c "admintools -t list_allnodes"
图9-1 查看数据库状态
· 分析组件从E61xx版本(E6115之前版本)升级到E65xx版本时,如果统一数字底盘需同步升级到分析组件E65xx版本的配套版本,则必须先将分析组件升级至E6115版本,再升级统一数字底盘,最后将分析组件从E6115升级至E65xx版本。如有特殊要求,请提前联系H3C工程师协调评估。
(1) 升级前准备工作
a. 升级前,在[分析>分析选项>资源管理>协议模板]页面下,先将SNMP和NETCONF的协议模板导出备份,如图9-2所示
图9-2 导出SNMP和NETCONF的协议模板
b. E61xx版本升级到E65xx版本后,需用户记住当前配置的采集模板信息,根据(5)配置采集模版重新配置采集模板。
· NETCONF不支持导出密码,在导出模板前需要记录对应的密码,并在升级完成后重新配置。
· 升级前请注意记录各个设备采用的是何种模板,升级后需在[分析>分析选项>资源管理>资产管理>资产列表]页面重新配置协议模板。
· E61xx版本升级到E65xx版本后,采集模板丢失,分析功能不可用,需用户重新配置采集模板。
统一数字底盘升级请参考《H3C统一数字底盘部署指导》。
a. 登录统一数字底盘,单击[系统>部署管理]菜单项,进入部署管理页面。
图9-3 部署管理页面-展开组件信息
c. 单击Analyzer-<组件名称>组件“操作”区段的按钮,进入升级页面。
图9-4 升级页面
d. 单击<上传>按钮,上传待升级的安装包。
e. 安装包上传成功后,勾选安装包,单击页面下方的<升级>按钮,完成组件升级。
· 分析组件暂不支持升级失败后的回滚操作,若升级失败建议重试,多次重试无效请联系技术人员。
· 对分析组件整体升级,即所有组件全部升级,可以跨版本升级,版本号统一变成升级后的版本号。
· 对分析组件整体升级时,要先升级Analyzer-Platform基础组件,再升级Analyzer-Telemetry组件(如有),其他组件则无升级顺序要求。
· 在WAN场景下,升级Analyzer-Telemetry组件后,还需要对Analyzer-WAN组件执行升级操作,否则将导致[健康分析>网络分析>网络业务分析]菜单项丢失。
a. 在[系统>部署管理]页面下,安装Analyzer-Collector组件,网络方案选择跟旧版本一致。例如:原来是“南向单协议”的,安装采集组件时也选择“南向单协议”;
图9-5 部署管理
b. 单击下一步,一直到“网络绑定”阶段,选择之前的网络配置,如图9-6所示;
c. 单击下一步,确认参数,部署完成;
d. 公共采集服务部署完成后,需要在[分析>分析选项>采集管理>模板管理]页面,导入对应的SNMP、NETCONF协议模板;
图9-7 导入SNMP、NETCONF协议模板
当分析组件升级完成后,采集模板丢失,设备将绑定默认的采集模板。
a. 进入[分析>分析选项>统一采集]页面,分别在SNMP和NETCONF页面下,单击<(继承)增加>按钮,在弹框中配置采集模板。
图9-8 配置采集模板
b. 进入[分析>分析选项>资源管理>资产管理>资产列表]页面,选择对应的资产。
c. 单击<设置协议>按钮,选择设置SNMP或NETCONF模板,在弹框中勾选需要绑定的采集模板。
图9-9 选择模板类型
d. 模板勾选完成后,单击<确定>按钮,完成采集模板的绑定。
图9-10 绑定采集模板
· 分析组件暂不支持升级失败后的回滚操作。
· SEERANALYZER版本名称不一致不能互相升级,即,SEERANALYZER-Exx-CK_X86_64的版本只能从SEERANALYZER-Exx-CK_X86_64升级;SEERANALYZER-Exx_X86_64的版本只能从SEERANALYZER-Exx_X86_64升级;SEERANALYZER-Exx-CK_ARM的版本只能从SEERANALYZER-Exx-CK_ARM升级。
· 对分析组件整体升级,即所有组件全部升级,可以跨版本升级,版本号统一变成升级后的版本号。
· 对分析组件整体升级时,必须先依次升级Analyzer-Collector组件、Analyzer-Platform基础组件、Analyzer-Telemetry组件和Analyzer-WAN组件(如果已安装Analyzer-WAN组件),最后升级其它组件(无顺序要求)。
· 当分析组件从E6309版本及其补丁版本升级到E6309以上版本时,对应的Cloudnet需同步升级到最新配套版本,并且需要先升级分析组件再升级Cloudnet组件。
· Analyzer-Simulation组件不支持从E6502之前的版本平滑升级到E6502及以后的版本,需卸载Analyzer-Simulation组件后重新安装。
· Analyzer-Collector组件应用包原包含在统一数字底盘E0711及E0711H07之前的版本发布包中,SeerAnalyzer E6313及E6313之后的版本发布包中开始包含Analyzer-Collector组件应用包。部署SeerAnalyzer E6313之前的版本时,请使用统一数字底盘E0711及E0711H07之前的版本发布包中的Analyzer-Collector组件应用包(E0711H05版本中的包名为IA-collector-E0711H05_xx,需解压为Analyzer-Collector组件应用包后使用)。部署SeerAnalyzer E6313及之后的版本时,请使用SeerAnalyzer中的Analyzer-Collector组件应用包。
· 在WAN场景下,升级Analyzer-Telemetry组件后,还需要对Analyzer-WAN组件执行升级操作,否则将导致[健康分析>网络分析>网络业务分析]菜单项丢失。
· 升级Analyzer-Platform基础组件后,在任务管理模块下的flink类型的任务,任务参数(taskmanager进程内存限制、taskmanager容器内存限制、taskmanager容器cpu限制、taskmanager slot数、taskmanager副本数、并行度)会恢复成默认值。
· 补丁包升级时,请按照对应版本说明书升级。
· 从H3C SeerAnalyzer E6313及补丁版本、E6315及补丁版本升级到其它版本时,旧版本可能占用了8443端口,需参考《H3C SEERANALYZER 释放8443端口指导手册》先释放8443端口,再升级统一数字底盘,最后再升级分析组件。
· 在ARM架构下,分析组件不支持从SeerAnalyzer-E6505版本升级到SeerAnalyzer-E6505P01版本。
(1) 如果是参照5.2.1 部署分析组件(统一数字底盘E0713之前版本)安装的分析组件,请登录统一数字底盘,单击[系统>部署管理]菜单项,进入部署管理页面。如果是参照5.2.2 部署分析组件(统一数字底盘E0713及之后版本)安装的分析组件,请登录Matrix页面,单击[部署>融合部署]菜单项,进入部署管理页面。
图9-11 部署管理页面-展开组件信息
图9-12 融合部署页面-展开组件信息
图9-13 部署管理-升级页面
图9-14 融合部署-升级页面1
图9-15 融合部署-升级页面2
(4) 单击<上传>按钮,上传待升级的安装包。
(5) 安装包上传成功后,勾选安装包。融合部署页面进行升级操作,支持批量升级,即一次勾选多个不同组件的安装包。勾选完成后,单击页面下方的<升级>按钮,完成组件升级。
· 在进行扩容操作之前,请提前备份Matrix、统一数字底盘和组件。若扩容失败,可使用备份文件对配置和数据进行恢复。
· 组件的扩容操作只能在统一数字底盘上进行。
· 若分析组件使用ClickHouse数据库,不支持单机扩集群;若分析组件使用Vertica数据库,支持单机扩集群。
统一数字底盘和组件扩容有以下两种情况:
· 单机部署模式扩容为集群部署模式,此种模式下,需在Matrix上同时增加两个Master节点并与原Master节点组成三机集群,然后依次扩容统一数字底盘和组件。
· 集群模式扩容,此种模式下,需在Matrix上先增加Worker节点,部署集群,然后扩容组件。
其中,分析组件扩容分为单机扩容和集群扩容,COLLECTOR公共采集组件目前仅支持单机扩容。
(2) 扩容Matrix
(3) 扩容统一数字底盘(集群模式无需此步骤)
(4) 为南向附加网络添加主机的上行口(分析组件无需此步骤)
(5) 配置扩容参数
(6) 扩容后状态检查
· 分析组件运行无故障
· COLLECTOR公共采集组件运行无故障
· 扩容节点的系统、磁盘分区需要与已部署的节点保持一致且网络连通
(1) 登录到分析组件单机/集群任一Master节点。
(2) 查看分析组件Pod运行状态,显示0代表正常,非0值代表异常。若服务异常,请联系H3C技术支持工程师解决。
[root@matrix01 ~]# kubectl get po -nsa |grep –v NAME |grep -v Completed | grep -iv Running | wc -l
(3) 查看采集器Pod运行状态,显示0代表正常,非0值代表异常。若服务异常,请联系H3C技术支持工程师解决。
[root@matrix01 ~]# kubectl get po -ncommon |grep –v NAME | grep -iv Running | wc -l
(4) 查看MPP数据库(Vertica版本)运行状态是否正常。
[root@matrix01 ~]# su - dbadmin
[dbadmin@matrix01 ~]$ admintools
a. 选择1,输入回车键确认选择。
图10-1 执行完admintools命令后回显
b. 观察箭头指示处值是否为UP:UP代表正常,其余值代表异常。
图10-2 MPP数据库状态
c. 检查完,选中E后键盘输入回车退出。
图10-3 退出
d. 执行exit命令退出MPP数据库检查。
(5) 登录统一数字底盘,在[分析>健康分析>网络健康度]页面查看网络健康状况是否正常。
(6) 登录统一数字底盘,在[分析>分析选项>任务管理]页面查看任务状况是否正常运行。
· 如下内容适用于统一数字底盘E0709及以上、分析组件E6302及以上和COLLECTOR公共采集组件E0709及以上版本的扩容操作。
· 如果COLLECTOR公共采集组件南向附加网络使用单独的一块网卡,那么新增的节点也需要两块网卡,并且在统一数字底盘组件扩容后以及采集组件扩容之前启用该节点的南向网卡。
· 待扩容节点的GlusterFS预留磁盘空间不能小于Master节点的GlusterFS容量。
· 如需扩容统一数字底盘,需先扩容Matrix,且Matrix扩容后,统一数字底盘扩容前,请不要进行其他操作。
(1) 在新增的两台服务器上部署Matrix,应使用和原Matrix节点相同版本的软件包。
(2) 登录单机部署Matrix页面,点击“部署”页签,在弹出的菜单中选择“集群”,进入集群部署页面。
(3) 点击Master节点区域的增加图标,增加2个Master节点。
(4) 单击<开始部署>按钮,进行集群扩容。扩容时间较长,请耐心等待。
(1) 在浏览器输入http://ip_address:30000/central后回车,登录统一数字底盘,在[系统>部署管理>网络配置]页面,为附加网络添加主机的上行口。如果配置有南向网络,需要特别指定南向网卡上行口。
若通过Matrix融合部署页面安装统一数字底盘和分析组件,则需要在Matrix的[部署>集群>网络]页面进行网络配置。
图10-4 添加上行口
(2) 在浏览器输入https://ip_address:8443/matrix/ui后回车,登录Matrix,在[部署>应用]页面,单击右上角<扩容应用>按钮,进入扩容应用的配置页面,选择“gluster”、“SYSTEM”后,单击<下一步>按钮。
请根据各方案实际情况,确保SYSTEM下的所有组件版本都支持扩容,再执行扩容操作。
(3) “配置共享存储”与“配置数据库”页面均无操作,直接单击<下一步>按钮。
(4) 在“配置参数”页面可以修改各配置项的参数。在gluster配置参数栏填写三个节点的预留硬盘信息,在system配置参数栏下配置expansion-config扩容参数,参数内容如下所示:
¡ ExpansionType为扩容类型,值为“Standalone2Cluster”表示单机扩容,不需要修改。
ExpansionCollectNodes为配置的扩容节点名称,其值需要用英文逗号隔开。例如,原有节点UC1,需要扩容UC2和UC3,填写“UC2,UC3”。
图10-5 配置扩容参数
以上步骤执行完成后,单击<完成>按钮开始扩容。
图10-6 开始扩容
(1) 登录Matrix页面,在[向导>集群扩容]页面查看gluster的挂载目录,需要注意的是,参数配置要正确,挂载的分区要真实存在,和安装时的配置类似。
图10-7 gluster配置项参数
(2) 在[部署>应用]页面,单击右上角<扩容应用>按钮,进入扩容应用的配置页面,选择需要扩容的应用。
图10-8 选择扩容产品页面
(3) “配置共享存储”与“配置数据库”页面均无操作,直接单击<下一步>按钮。
(4) 在“配置参数”页面配置扩容参数
expansion-config表示扩容参数配置,参数如下所示:
¡ ExpansionType为扩容类型,值为“Standalone2Cluster”表示单机扩容,不需要修改。
¡ ExpansionBaseLabelNodes为配置的扩容节点名称,其值需要用逗号隔开。例如,原有节点UC1,需要扩容UC2和UC3,填写“UC2,UC3”。
¡ ExpansionKafkaLabelNodes为配置的扩容节点名称,其值需要用逗号隔开。例如,原有节点UC1,需要扩容UC2和UC3,填写“UC2,UC3”。
¡ ExpansionMPPLabelNodes为配置的扩容节点名称,其值需要用逗号隔开。例如,原有节点UC1,需要扩容UC2和UC3,填写“UC2,UC3”。
图10-9 配置扩容参数
以上步骤完成后,单击<扩容>按钮,开始扩容。
图10-10 开始扩容
在Master节点查看Pod状态,如均显示Running,则表示扩容成功。
[root@matrix01 ~]# kubectl get po -nsa |grep -v Completed
集群部署模式扩容只需要扩容Matrix,不需要扩容统一数字底盘。
(1) 在新增的服务器上部署Matrix,应使用和原Matrix节点相同版本的软件包。
(2) 登录集群部署的Matrix页面,点击“部署”页签,在弹出的菜单中选择“集群”,进入集群部署页面。
(3) 单击Worker节点区域的增加图标,增加1个Worker节点。如需增加多个Worker节点,可重复点击增加图标;也可单击<批量增加>按钮,通过上传模板文件实现批量增加Worker节点。
(4) 单击<开始部署>按钮,进行集群扩容。扩容时间较长,请耐心等待。
(1) 登录Matrix,在[部署>应用]页面,单击components大数据组件“操作”区段的图标,进入组件应用详情页面。
图10-11 应用列表页面
(2) 单击<扩容>按钮,进入配置扩容参数页面。
图10-12 扩容按钮
(3) 配置扩容参数。
图10-13 扩容页面
expansion-config表示扩容参数配置,参数如下所示:
¡ ExpansionType为扩容类型,值为“Standalone2Cluster”表示单机扩容,需要更改为空字符””表示集群扩容。若是集群扩容,每次只能扩容一个Worker节点。
¡ ExpansionBaseLabelNodes为配置的扩容节点名称,其值需要用英文逗号隔开。例如,原有节点UC1,UC2,UC3,需要扩容UC4和UC5,需要经过两次扩容,第一次扩容填写“UC4”或“UC5”,执行完扩容操作后,再重复以上扩容步骤,第二次扩容填写另外一个待扩容节点。
¡ ExpansionKafkaLabelNodes为配置的扩容节点名称,其值需要用英文逗号隔开。例如,原有节点UC1,UC2,UC3,需要扩容UC4和UC5,需要经过两次扩容,第一次扩容填写“UC4”或“UC5”,执行完扩容操作后,再重复以上扩容步骤,第二次扩容填写另外一个待扩容节点。
¡ ExpansionMPPLabelNodes为配置的扩容节点名称,其值需要用英文逗号隔开。例如,原有节点UC1,UC2,UC3,需要扩容UC4和UC5,需要经过两次扩容,第一次扩容填写“UC4”或“UC5”,执行完扩容操作后,再重复以上扩容步骤,第二次扩容填写另外一个待扩容节点。
以上步骤完成后,单击<扩容>按钮,开始扩容。
在Master节点查看Pod状态,如均显示Running,则表示扩容成功。
[root@matrix01 ~]# kubectl get po -nsa |grep -v Completed
(1) 登录Matrix,点击“部署”页签,在弹出的菜单中选择“安全 > 安全策略”选项,进入安全策略页面。
(2) 单击<增加>按钮,进入增加安全策略页面。
(3) 在“基本设置”区域配置默认动作为“允许”。
(4) 在“规则信息”区域单击<增加>按钮,在弹出窗口中配置如下规则:
¡ 源地址为节点上除Matrix使用的网卡外的其它网卡IP。
¡ 协议类型为TCP。
¡ 目标端口必须输入为:
8101,44444,2379,2380,8088,6443,10251,10252,10250,10255,10256。
¡ 动作为允许。
(5) 配置完成后单击<应用>按钮。
必须将所有节点上除Matrix使用的网卡外的其它网卡IP都加入到安全策略中。
例如节点1上除Matrix使用的网卡外还有一个网卡的IP为1.1.1.1,节点2上除Matrix使用的网卡外的网卡IP为2.2.2.2,节点3上除Matrix使用的网卡外的网卡IP为3.3.3.3,则需要在安全策略的规则中增加3条规则,源地址分别为1.1.1.1、2.2.2.2、3.3.3.3,协议类型都是TCP,目标端口都是“8101,44444,2379,2380,8088,6443,10251,10252,10250,10255,10256”,动作都为允许。
图11-1 安全策略举例
(6) 开启被关掉的网卡,下面以eth33为例。
[root@node01 ~]# ifup eth33
(1) 节点上安装操作系统完成后,修改所有节点ssh端口
修改/etc/ssh/sshd_config配置文件。
将#Port 22改为想要修改的端口,如Port 2244。
重启sshd服务:
systemctl restart sshd.service
查看新端口是否监听:
netstat –anp | grep –w 2244
(2) 使用vim /opt/matrix/config/navigator_config.json命令进入navigator_config文件,查看该文件中是否存在sshPort字段,若存在,将该字段取值修改为用户想要指定的端口号(以12345为例);若不存在,则需手动添加该字段并为其赋值。
{
"productName": "uc",
"pageList": ["SYS_CONFIG", "DEPLOY", "APP_DEPLOY"],
"defaultPackages": ["common_PLAT_GlusterFS_2.0_E0707_x86.zip", "general_PLAT_portal_2.0_E0707_x86.zip", "general_PLAT_kernel_2.0_E0707_x86.zip"],
"url": "http://${vip}:30000/central/index.html#/ucenter-deploy",
"theme":"darkblue",
"matrixLeaderLeaseDuration": 30,
"matrixLeaderRetryPeriod": 2,
"sshPort": 12345
}
(3) 修改完成后,需重启Matrix服务
[root@node-worker ~]# systemctl restart matrix
(4) 查看新的端口号是否修改成功,若成功,则日志中最后一条信息如下。
[root@node-worker ~]# cat /var/log/matrix-diag/Matrix/Matrix/matrix.log | grep "ssh port"
2022-03-24T03:46:22,695 | INFO | FelixStartLevel | CommonUtil.start:232 | ssh port = 12345.
ssh_port说明:
· 此端口为ssh远程其他节点端口,所以必须保证集群中所有节点(包括Master和Worker),只能使用统一的ssh端口。
· 务必同时重启所有节点Matrix服务,Matrix服务会读取配置文件中ssh端口。
(5) 部署Matrix
参照Matrix安装部署指导部署Matrix。
统一数字底盘和分析组件需升级为支持ssh端口修改的版本(E6215及更高版本) ,在未升级到支持ssh端口修改版本之前请不要更改ssh 默认端口,升级完成后方可参照上述(1)、(2)、(3)步骤修改ssh端口。
分析组件在部署或升级的过程中可能因为超时导致部署或升级失败,建议重试或终止升级后重试。若重试依旧失败,需要联系技术服务人员协助定位问题。
统一数字底盘采用Kubernetes+Docker的微服务技术架构,当前底盘默认对微服务数量的限制是不超过300个,在园区场景单机融合部署时(指单机部署园区管控全套产品:统一数字底盘+vDHCP+SE+EIA+WSM+SA),微服务数量会超过该限制,需要对Kubernetes启动参数进行调整,当前微服务数量不会超过400个,具体操作步骤如下:
(1) 首先确认当前单机环境已部署Matrix,且系统运行正常。
(2) 进入后台命令行,编辑Kubernetes的配置文件:
vi /etc/systemd/system/kubelet.service.d/10-kubeadm.conf
将--max-pods=300改为--max-pods=400
(3) 保存配置文件之后,重启kubelet服务即可生效
systemctl daemon-reload && systemctl restart kubelet
修改节点和集群IP地址的时候,由于Matrix/统一数字底盘组件和分析组件都需要执行钩子脚本,很容易因为环境性能差、脚本执行超时之类问题导致修改IP失败,必须重新改回原来的节点和集群地址,而不能重新换一组IP地址进行修改。否则会引发Vertica不可用。
一般是由于普通操作员(非管理员)账号在创建时未绑定有查看分析组件权限的角色组导致,若需要获得权限,则需要在[系统>操作员管理>操作员列表]页面新增操作员时绑定有查看分析组件权限的角色组。
图11-2 增加操作员
角色组权限可在[系统>角色组列表]页面下的“权限列表”子页面中查看。
图11-3 角色组权限
请在相关网站(如https://pkgs.org/)获取numactl软件包并安装。
(1) 查询网卡pcie地址,例如某个环境的采集网卡pcie是:43:00.1。
lspci | grep Eth
(2) 查询网卡所在numa节点id。
cat /sys/bus/pci/devices/0000\:43\:00.1/numa_node
(3) 执行命令:numactl –H,查询numa对应节点是否有被分配内存。
以步骤(2)查询到的numa node 4节点为例(4即为查询到的numa节点id,id不固定,根据实际部署情况而定),查询结果表明numa node 4有内存:
node 4 cpus: 24 25 26 27 28 29 72 73 74 75 76 77
node 4 size: 32768 MB
node 4 free: 27161 MB
使用kafka-console-consumer.sh消费Kafka监控时,当没有设置超时时间时,该脚本不会主动停止消费,当用户忘记关闭时,该消费不会自动停止,将会增加系统执行压力。因此,需要对消费脚本sa-console-consumer.sh增加默认超时配置,默认时间为60秒。请后续使用该脚本进行Kafka消费监控时,需进入对应Kafka Pod进行如下配置:
./sa-console-consumer.sh --timeout 5 --bootstrap-server itoa-kafka-service1:6667 --topic test001
执行脚本sa-console-consumer.sh后面必须紧跟--timeout value参数或者不配置该参数,接着紧跟kafka-console-consumer.sh需要的参数。
value的单位为:秒,“--timeout 5”即配置5秒后程序自动退出,如果不配置“--timeout”参数及其具体秒数,默认60秒自动退出。
通常来说,超线程功能在BIOS里是默认开启的,可在BIOS中找到Hyper-Thread项,查看超线程是否开启。
图11-4 查看超线程功能是否开启
(1) 进入SeerCollector采集器后台,修改/etc/default/grub文件,增加amd_iommu=on iommu=pt配置内容。
[root@h3clinux1 ~]# vi /etc/default/grub
复制如下内容对原文件配置内容进行覆盖:
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto rhgb quiet amd_iommu=on iommu=pt"
GRUB_DISABLE_RECOVERY="true"
(2) 执行如下命令。
¡ 如果服务器是UEFI启动,执行如下命令
[root@h3clinux1 ~]# grub2-mkconfig -o /boot/efi/EFI/*/grub.cfg
¡ 如果服务器是普通模式启动,执行如下命令
[root@h3clinux1 ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
(3) 重启服务器。
[root@h3clinux1 ~]# reboot
问题现象:若采用“南北向网络合一”(南向无网络)方案部署公共采集组件且未安装network组件时,分析组件的SNMP-Trap采集功能不可用。
解决方案:进入[监控>告警管理>Trap管理>Trap过滤规则]页面,禁用“未定义Trap过滤”和“重复Trap过滤”规则。
图11-5 禁用Trap过滤规则
问题现象:从旧版本升级到E6501版本后,SeerCollector采集器任务显示“停止”状态,任务停止下发。
图11-6 先知采集器页面
解决方案:进入[分析>分析选项>采集管理>采集器管理>先知采集器]页面,找到任务状态异常的SeerCollector采集器,单击“操作”区段的,任务即可正常下发,任务状态显示“运行”。
问题现象:当按照4.2.2 数据盘RAID和分区规划推荐的数据盘分区规划进行分区,但是未修改文件系统类型导致部署分析组件失败。
解决方案:
(1) 检查文件系统类型是否为ext4类型:
[root@sa1 ~]# mount -l | grep sa_data
/dev/vdb1 on /sa_data type xfs (rw,relatime,seclabel,attr2,inode64,noquota)
/dev/vdb3 on /sa_data/kafka_data type xfs (rw,relatime,seclabel,attr2,inode64,noquota)
/dev/vdb2 on /sa_data/mpp_data type ext4 (rw,relatime,seclabel,data=ordered)
(2) 如果不是ext4类型,请按照如下操作修改为ext4类型。注意:要先卸载采集组件,采集的kafka数据也放在/sa_data/kafka_data下面。
(3) 去掉挂载(注意顺序,/sa_data要在最后)。
[root@sa1 ~]# umount /sa_data/kafka_data
[root@sa1 ~]# umount /sa_data/mpp_data
[root@sa1 ~]# umount /sa_data
(4) 使用指令mkfs.ext4 /dev/vdb1重新格式化分区(非ext4的数据盘分区都要执行)。
(5) 使用指令获取新的UUID,过滤条件为对应的磁盘分区,用‘|’隔开。
[root@sa1 ~]# ll /dev/disk/by-uuid | grep -E 'vdb1|vdb2|vdb3'
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 -> ../../vdb1
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 c9da5aba-80b9-4202-ba16-b222462a0329 -> ../../vdb3
lrwxrwxrwx. 1 root root 10 Jun 7 15:40 cac87013-f014-40df-9aca-af76888b1823 -> ../../vdb2
(6) 使用vim /etc/fstab命令替换新的UUID以及修改分区格式类型为ext4。
(7) 查看修改后的文件。
[root@ sa1 ~]# cat /etc/fstab
#
# /etc/fstab
# Created by anaconda on Wed Dec 7 15:44:15 2022
#
# Accessible filesystems, by reference, are maintained under '/dev/disk‘
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=519f9af7-12ce-4567-b62c-2315cad14f56 / xfs defaults 0 0
UUID=83628a24-94f5-4937-b016-64d0f72bd98d /boot xfs defaults 0 0
UUID=3B96-1B3A /boot/efi vfat defaults,uid=0,gid=0,umask=0077,shortname=winnt 0 0
UUID=89b86ff9-e7ee-4426-ba01-61e78ca6f4b1 /sa_data ext4 defaults 0 0
UUID=c9da5aba-80b9-4202-ba16-b222462a0329 /sa_data/kafka_data ext4 defaults 0 0
UUID=cac87013-f014-40df-9aca-af76888b1823 /sa_data/mpp_data ext4 defaults 0 0
UUID=51987141-f160-4886-ad51-bc788ec2176c /var/lib/docker xfs defaults 0 0
UUID=4e91a1b8-4890-4a41-be00-098ded6b8102 /var/lib/etcd xfs defaults 0 0
UUID=2554963b-03e7-4be4-b214-7350f2eb3df9 /var/lib/ssdata xfs defaults 0 0
#UUID=a22041b8-7c7c-4730-bc1f-634306145e36 swap swap defaults 0 0
(8) 执行mount -a进行挂载。
出现下报错为正常现象:
mount: 挂载点 /sa_data/kafka_data 不存在
mount: 挂载点 /sa_data/mpp_data 不存在
(9) 创建不存在的目录。
[root@ sa1 ~]# mkdir -p /sa_data/kafka_data
[root@ sa1 ~]# mkdir -p /sa_data/mpp_data
(10) 再次执行mount -a进行挂载即可完成文件系统类型的修改。
(11) 集群环境请在所有分析组件节点执行同样的操作。
问题现象:部署Analyzer-Platform组件失败,且报错“环境中出现如下异常:路径:/sa_data未挂载”。
解决方案:请检查数据盘是否是按照本文要求进行规划、且文件系统类型是否为ext4格式,若不是则请按照本文要求重新规划磁盘。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!