手册下载
用户手册
资料版本:5W100-20230731
Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
目 录
随着数字化转型浪潮的推进,越来越多的业务流程被整合为数字化系统,企业网络已经成为企业生存发展的基石,网络环境的稳定性决定了企业日常业务能否稳定开展。随着企业网络规模的快速扩张,网络运维人员面临着网络复杂度激增与系统稳定性要求提升的双重压力。当今企业的核心网络设备上可能承载了成百上千个应用,传统网络运维手段只能通过分析设备运行指标来监控网络运行状态,无法精准监控到每一个应用的网络运行质量或用户的用网体验。当网络中部分应用或用户出现网络性能出现劣化问题时,传统运维手段很难有效的快速定位问题原因,网络一旦产生故障,需要多部门配合、人工排查,往往处理问题进度慢、界定责任难。业务对网络可靠性及最小化故障恢复时间都提出了更高的要求,传统的运维手段在问题发现、问题定位和问题解决的过程中逐渐变得力不从心。
面对数字化转型进程中网络运维的困难,园区分析组件(SeerAnalyzer-Campus)这一大数据和AI加持的新一代网络智能分析系统。分析组件采用Telemetry等技术实时全量采集网络运行状态数据,利用大数据技术对这些数据进行高效的预处理和存储,使用高性能计算引擎对海量数据进行实时和离线计算,通过专家知识和场景AI算法对复杂的数据进行智能分析,洞察全网健康状态和问题,结合专家知识和关联算法对问题进行根因定位,并对关键故障进行AI预测。
在追求网络最小化故障恢复时间的同时,为了尽可能减少网络故障对业务的影响,甚至达到业务对网络故障的无感体验,Analyzer利用Telemetry高速的数据采集和准实时故障识别能力,结合近20年的网络运维技术经验积累,实现了故障的快速界定、取证以及和控制组件连动的隔离闭环。
分析组件基于统一数字底盘,采用微服务技术架构(Kubernetes+Docker),通过Telemetry Stream技术准实时采集设备数据(周期采集、自动上报),并利用大数据技术提供海量数据存储以及实时流处理分析、利用机器学习算法进行趋势预测和异常检测,为客户提供实时的网络、用户、应用健康度计算及展示,自动分析识别园区网络故障,并结合园区控制组件形成故障闭环。
图1-1 产品架构
· 网络分析:基于设备系统平面、数据平面、控制平面,以及空口性能等维度信息,综合评估设备的健康度。同时,支持对网络设备的资源使用情况进行监控,跟踪资源变更记录和波动趋势。
· 用户分析:基于AC和交换机上报的终端数据,实时评估终端用户的接入健康度,并分析影响健康度的因素。同时,对终端接入相关的指标进行统计和分析。
· 应用分析:基于DPI检测和iNQA分析,识别网络中的应用,并展示应用的流量、丢包、时延、抖动等信息。
· 网络维度:展示每个设备的健康度变化趋势、系统状态、表项资源、端口、链路等信息。
· 用户维度:展示每个用户的终端信息,健康度变化趋势,局部拓扑,接入旅程,协议回放等;对于质差用户给出影响用户质量的关键指标分析以及根因建议。
· 应用维度:展示每个应用的流量统计以及关联用户变化趋势,针对每个应用会话展示时延、抖动、丢包等质量信息。
· 基于各项指标数据的静态阈值和动态基线,实时监控设备指标数据是否正常。
· 可以实时感知设备环境的变化,并在发生异常故障时,及时推送告警。
· 可以详细展示故障的类型,故障的对象,故障发生的时间,并快速完成故障根因分析。
· 针对不同类型故障,系统可提供建议方案,恢复方案或隔离方案,确保故障快速恢复。
· 提供一键诊断能力,快速完成网络体检,快速修复的异常项(或可优化项)。
· Doctor AP,一种高效的基于用户体验的问题定位方式,帮助运维人员快速解决体验类网络问题。
· 提供一键优化能力,一键实现全网智能无线射频调优,自动调优。
· 渐进优化,持续提升用户体验,使用户在使用网络时始终处于最优状态。
· 问题智愈,自动识别发现无线网络中的问题,并且在无需人工介入的情况下,及时解决问题,实现网络自优化。
分析组件基于统一数字底盘部署。具体安装过程请参见《H3C SeerAnalyzer安装部署指导》。
分析组件安装完成后,具体功能的配置请参考《AD-Campus 分析组件配置指导》。
· 一屏概览全网运行状态:从全局角度,直观展示设备、用户、应用三大维度的健康状态以及实时变化趋势。并将园区问题按问题分类和严重级别进行分类展示,同时给出质差用户、质差设备的根因分析,方便用户快速锁定问题范围。
图2-1 全网运行状态
· 全网拓扑统一展示:物理拓扑可以图形化实时查看当前园区网络中的设备状态以及链路状态。
图2-2 全网拓扑
· 区域概览:以区域为维度对网络、用户健康进行分类统计。列表中各区域网络健康及用户健康一目了然,方便找出低健康度的区域,并可跳转查看对应的区域网络/用户健康度概览及其详情。
图2-3 区域健康度
· 楼层拓扑:可以将关注视角直接锁定到具体的楼层中,直观查看每个楼层的平面图,以及当前AP设备的摆放位置及健康状态。
图2-4 楼层拓扑
· 无线质量分析:展示园区无线用户体验质量的整体评估结果。基于上线成功率、上线耗时、覆盖、漫游达标率、容量健康度、吞吐达标率、无线设备在服率建立7大类指标监控体系,呈现用户网络体验质量的整体评估结果,并给出了各类子指标趋势和分析。
图2-5 无线质量
分析组件目前支持3种数据源:DPI(无线应用)数据,iNQA(有线应用)数据及eMDI+SQA(音视频)数据。可分别对无线应用 、有线应用,以及音视频应用进行识别、流量分析,以及质量分析。
图2-6 应用健康度
系统支持SIP、H323协议音视频会议终端质量分析,支持查看会议参与者音视频流质量,包括MOS、丢包率、时延、抖动等,并根据音视频流路径上设备监测音视频质量快速确定故障点。支持质差分析及异常掉线分析,并给出大概率根因及建议。
图2-7 音视频质量分析
· 网络健康度:从网络(设备)的维度实时展示园区设备健康状态以及变化趋势图,并对设备分角色进行健康统计,方便用户快速定位问题设备。
¡ 网络健康度展示园区所有纳管设备,支持用户查看设备详情,平台通过SNMP/Netconf/Telemetry等多种采集方式收集设备信息,在设备详情中进行全方位展示。支持园区交换机、BRAS、AC、AP,以及EPON设备的健康度分析。
¡ 设备详情展示设备的健康度趋势,20+KPI指标得分,得分最低指标,设备问题列表,连接拓扑、表项资源、运行状态等信息,协助用户快速解决问题。其中表项资源中,对设备40+表项资源进行监控,基于AI识别异常变化,并对未来趋势进行预测,超过阈值或上下界波动范围自动产生告警,方便用户及时调整和规划网络。
图2-8 网络健康度
· 网络变更分析
通过Netconf,gRPC实时采集全网设备的运行配置,ARP,MAC,路由表等转发表项信息,支持全量采集和增量上报。通过大数据分析,自动生成全网设备的配置变更和表项变更的详细信息,提供变更趋势,变更详情,变更对比,和历史回溯等功能,辅助快速定位网络故障。
图2-9 变更分析
从终端用户维度,根据用户的接入指标、接入问题评估用户接入的健康度,同时基于接入耗时、上线/认证/DHCP失败统计、RSSI、SSID、频段等对终端进行统计分析、上线分析等,使终端整体运行状态更直观可视。
· 用户详情:全方位展示用户健康度趋势,AP迁移信息、连接拓扑、问题分析,用户旅程等信息。其中健康度趋势图完整展示一段时间内用户的健康度变化情况,系统支持查看每个时间点的用户指标信息,以及关联AP的健康详情。AP迁移信息可直观展示出用户连接AP的历史轨迹。问题分析给出一段时间内用户的关键异常问题,如认证失败、认证慢、IP获取失败等。
图2-10 用户详情
· 用户旅程完整展示所选时间段内终端用户发生的事件,如漫游、上下线、DHCP等 ,关键事件可以展开查看详细的协议回放。协议回放展示用户接入网络的过程回放,接入过程通常包含关联、认证、DHCP、ARP、DNS等;对于异常事件,协议回放可直观呈现上线过程中每个协议的请求响应情况以及耗时信息,便于快速锁定问题。协议回放主要支持802.1x认证、Portal认证、BRAS认证以及DHCP交互过程。
图2-11 用户旅程
支持接收无线控制器上报的用户下线细化原因代码,并进行用户下线细化原因的呈现,包括但不限于终端漫游、用户主动下线、终端主动下线、网络侧发起下线等。
· 网络/设备/协议/Overlay/业务等常见故障,分钟级故障发现,定位根因并给出处理建议。
图2-12 异常分析
· 问题详情中,可查看故障对象,事件状态,开始时间,持续时间,根因分析,详细过程,处理建议等信息,部分故障支持下发闭环预案。
图2-13 问题详情
光模块在长时间使用过程中性能会逐渐下降,当性能下降到一定程度后,可能产生大量CRC错包,影响业务的正常运行。分析组件采集全网光模块KPI指标以及CRC错包信息,借助大数据分析和AI算法,主动监控光模块健康状态,并对未来趋势进行预测。
图2-14 光模块诊断
· 一键诊断:覆盖设备配置、网络状态、设备运行情况等项目;可灵活设置检查项,满足个性需求。
图2-15 一键诊断
· Doctor AP:支持从客户端的角度来诊断WLAN网络的健康程度,使用在线AP来模拟客户端的真实业务流程,并记录及分析探测结果,用户可以根据探测结果排查网络故障。
图2-16 Doctor AP
· 无线安全检测:通过对信道进行监听及分析处理,从中检测出威胁网络安全、干扰网络服务、影响网络性能的无线行为或设备,并提供对入侵的无线设备的反制,为无线网络提供一套完整的安全解决方案。
图2-17 无线安全检测
一款移动端APP诊断工具,针对园区用户的网络体验问题,实现客户端和后端分析组件的交互,利用分析组件的网络可用性评估和故障根因分析,使客户端实现一键问题诊断和故障上报,运维人员及时发现和响应用户问题。
图2-18 Cloudnet APP
定时或定期生成健康评估报告,多角度呈现全网区域健康状态及关键指标,并给出网络优化整改建议。
图2-19 健康报告设置
图2-20 质量评估报告
系统支持将用户设置成VIP用户,重点保障VIP用户的接入体验,可设置非VIP用户限速。
图2-21 VIP用户保障
· 一键调优:根据采集到的用户健康度信息以及连接或空口性能类故障,自动对无线体验不佳的AP的信道、功率、带宽进行一次优化调整,直观体现调整前后的对比,达到提升用户体验,简化维护的目的。
图2-22 一键调优
· 渐进优化:基于终端、AP等历史数据,应用大数据分析和AI算法,预判网络环境运行趋势(如终端潮汐轨迹、AP规律性高负载等),提前规划和调整射频参数,让网络来适配业务,以使用户在使用网络时始终处于最优,提升用户体验。
图2-23 渐进优化
多园区跨地域,为了减少WAN网数据传输,部署多套分析组件,主分析组件可以查看所有园区数据统计,也可以查看子分析组件详情,主分析组件定时获取子分析组件质量分析概要数据。
表2-1 术语说明表
术语 |
说明 |
SNMP |
Simple Network Management Protocol,简单网络管理协议,用于网络设备的远程管理和操作 |
NETCONF |
Network Configuration Protocol,网络配置协议,用于对网络设备进行配置和管理,支持编程 |
ERSPAN |
三层远程镜像技术,镜像报文封装为协议号是0x88BE的GRE报文,路由到远端监控设备,用于数据监测 |
SYSLOG |
SYSLOG协议,记录系统日志信息 |
Telemetry |
Telemetry Stream是一项从设备上采集数据的网络监控技术,用于向采集器上送数据 |
gRPC |
Google Remote Procedure Call,Google远程过程调用,用于网络设备进行配置和管理,可支持多种编程语言 |
eMDI |
Enhanced Media Delivery Index,增强型媒体传输质量指标,是一种专门为音视频业务(例如VoIP和IPTV)设计的故障界定和健康诊断技术。通过在音视频业务流量途径的网络节点上部署eMDI,可以对音视频业务流量进行实时监控,提取所需数据并计算监控指标。之后,网络管理员结合多个网络节点计算出的监控指标,可以了解网络状况、界定网络故障发生的位置、优化网络部署,以满足用户的音视频业务质量要求。 |
SQA |
Service Quality Analysis,服务质量分析,是在网络管理中一种用于评估网络服务质量的技术和方法。它可以通过采集、分析网络流量数据和监视应用服务质量(QoS)指标,来进行服务质量的评估和监控。 |
QoS |
Quality of Service,服务质量,对于网络业务,影响服务质量的因素包括传输的带宽、传送的时延、数据的丢包率等。在网络中可以通过保证传输的带宽、降低传送的时延、降低数据的丢包率以及时延抖动等措施来提高服务质量。网络资源总是有限的,在保证某类业务的服务质量的同时,可能就是在损害其它业务的服务质量。因此,网络管理者需要根据各种业务的特点来对网络资源进行合理的规划和分配,从而使网络资源得到高效利用 |
MOS |
Mean Opinion Score,服务质量评估值。MOS是音视频会话的质量指标,值越低表示质量越差 |
SIP |
Session Initiation Protocol,会话初始协议,是由IETF(Internet Engineering Task Force,因特网工程任务组)制定的多媒体通信协议。是一个用于建立、更改和终止多媒体会话的应用层控制协议,其中的会话可以是IP电话或多媒体会议。SIP是类似于HTTP协议的基于文本编码的协议,具有易扩展、易实现等特点,因此非常适合用来实现基于因特网的多媒体通信系统,可以用来解决IP网络中的信令控制,为电信、银行、金融等行业提供更好的增值业务 |
iNQA |
Intelligent Network Quality Analyzer,智能网络质量分析,是一种适用于大规模IP网络、可快速测量网络性能的检测机制 |
iNQA Collector |
iNQA中负责管理和控制测量点,周期性收集测量点产生的统计数据并上报给Analyzer |
iNQA Analyzer |
负责收集Collector上送的统计数据并完成数据的汇总和计算 |
EPON |
Ethernet Passive Optical Network,以太网无源光网络,是基于以太网的PON技术,它采用点到多点结构、无源光纤传输,在以太网之上提供多种业务。 |
OLT |
Optical Line Terminal,光线路终端,EPON系统的核心设备,用于统一管理ONU,并将接入业务汇聚和传递到IP网 |
POS |
Passive Optical Splitter,无源分光器,向OLT汇聚各ONU的上行数据,并将下行数据分发到各个ONU |
ONU |
Optical Network Unit,光网络单元,EPON系统的用户端设备,用于连接用户PC、机顶盒、交换机等,负责响应OLT发出的管理命令,并将用户数据转发到OLT |
DPI |
Deep Packet Inspection,深度报文检测,是一种基于应用层信息对流量进行检测和控制的安全功能。DPI支持丰富的业务类型(如防病毒、应用审计与管理等),可以阻断外部攻击、防止数据泄露、规范用户上网行为,极大的提高了网络的安全性 |
802.1X |
802.1X协议(全称为Port-Based Networks Access Control,基于端口的网络访问控制)是一种基于端口的网络接入控制协议,即在局域网接入设备的端口上对所接入的用户和设备进行认证,以便控制用户设备对网络资源的访问。作为局域网一种普遍的端口接入控制机制在以太网中被广泛应用,主要用以解决以太网内认证和安全方面的问题 |
IPoE |
IPoE(IP over Ethernet)是一种常见的IPoX接入方式,目前支持如下几种认证方式。 · 绑定认证是指BRAS(Broadband Remote Access Server,宽带远程接入服务器)设备根据用户接入的位置信息自动生成用户名和密码进行身份认证的一种认证方式,无需用户输入用户名和密码。 · Web认证是指用户通过访问Web认证服务器的认证页面,交互输入用户名和密码进行身份认证的一种认证方式。 · 802.1X认证,是一种通过在802.1X客户端中输入用户名/密码进行认证的一种方式。当需要在三层接口上实现802.1X方式接入时,可以配置802.1X认证方式。(非vBRAS-CP设备) |
Portal |
Portal认证通过Web页面接受用户输入的用户名和密码,对用户进行身份认证,以达到对用户访问进行控制的目的。Portal认证通常部署在接入层以及需要保护的关键数据入口处实施访问控制。在采用了Portal认证的组网环境中,用户可以主动访问已知的Portal Web服务器网站进行Portal认证,也可以访问任意非Portal Web服务器网站时,被强制访问Portal Web服务器网站,继而开始Portal认证。 |
DHCP |
Dynamic Host Configuration Protocol,动态主机配置协议。它采用客户端/服务器的通信模式。所有的IP 网络配置参数都由DHCP 服务器集中管理,并负责处理客户端的DHCP 请求;而客户端则会使用服务器分配的IP 网络参数进行通信。 |
MTU |
Maximum Transmission Unit,最大传输单元。是数据链路层(如以太网、无线网络等)中可传输的最大数据包大小,以字节为单位表示。简单来说,MTU规定了一个包传输的最大大小,超过MTU的包需要进行分割和重新拼接。修改接口的MTU值,会影响IP报文的分片与重组 |
VXLAN |
VXLAN(Virtual eXtensible LAN,可扩展虚拟局域网络)是基于IP网络、采用“MAC in UDP”封装形式的二层VPN技术。VXLAN可以基于已有的服务提供商或企业IP网络,为分散的物理站点提供二层互联,并能够为不同的租户提供业务隔离。VXLAN主要应用于数据中心网络。 |
VLAN |
VLAN(Virtual Local Area Network,虚拟局域网)技术把一个物理LAN划分成多个逻辑的LAN——VLAN,处于同一VLAN的主机能直接互通,而处于不同VLAN的主机则不能直接互通,从而增强了局域网的安全性。划分VLAN后,广播报文被限制在同一个VLAN内,即每个VLAN是一个广播域,有效地限制了广播域的范围。通过VLAN可以将不同的主机划分到不同的工作组,同一工作组的主机可以位于不同的物理位置,网络构建和维护更方便灵活。 |
VTEP |
VTEP(VXLAN Tunnel End Point,VXLAN隧道端点):VXLAN的边缘设备。VXLAN的相关处理都在VTEP上进行,例如识别以太网数据帧所属的VXLAN、基于VXLAN对数据帧进行二层转发、封装/解封装报文等。VTEP可以是一台独立的物理设备,也可以是虚拟机所在的服务器。 |
VNI |
VXLAN网络通过VXLAN ID来标识,VXLAN ID又称VNI(VXLAN Network Identifier,VXLAN网络标识符),其长度为24比特 |
VRF |
Virtual Routing and Forwarding,虚拟路由和转发。是一种在网络设备(如路由器、交换机等)中实现虚拟网络划分的技术。VRF可以将一个物理网络设备划分为多个逻辑的、独立的路由器,每个VRF就好像是独立的一个路由表,每个VRF可以拥有自己的路由规则和转发行为。 |
BGP |
BGP(Border Gateway Protocol,边界网关协议)是一种既可以用于不同AS(Autonomous System,自治系统)之间,又可以用于同一AS内部的动态路由协议。当BGP运行于同一AS内部时,被称为IBGP(Internal BGP);当BGP运行于不同AS之间时,称为EBGP(External BGP)。AS是拥有同一选路策略,属于同一技术管理部门的一组路由器 |
BGP发言者和对等体 |
运行BGP协议的路由器称为BGP发言者。BGP发言者接收或产生路由信息,并将路由信息发布给其它BGP发言者。 相互之间存在TCP连接、相互交换路由信息的BGP发言者互为BGP对等体。 |
· 园区健康
展示所选时间段内结束时间的设备健康度、用户健康度、应用健康度。单击设备(用户、应用)健康度圆环或者圆环右侧<好>、<一般>、<差>,可进入设备(用户、应用)对应的健康度查看列表信息。用户健康度情况(好终端的数量占在线终端的比例。好终端的判断标准是通过终端的信号强度、时延、丢包率等十几种相关的指标,综合计算评价得出:好(8~10分)、一般(4~7分)、差(1~3分))。
· 设备健康度趋势
用折线图展示设备(路由器、Spine、Leaf、Access、AC、AP)在所选时间段内的健康度变化情况,当鼠标悬停在折线某处时,悬浮框将会展示此时刻该类设备的健康度。
· 设备质差根因分析
展示所选时间段内最新设备健康度质差根因统计分布。
· 用户健康度趋势
用折线图展示在所选时间段内的无线终端和有线终端的健康度变化情况(健康度趋势:好终端的数量占在线终端的比例),当鼠标悬停在折线某处时,折线图的下方将会展示此时刻该终端的健康度和系统状态。单个终端健康度评价方法:好(8~10分)、一般(4~7分)、差(1~3分)。
· 用户质差根因分析
展示所选时间段内最新用户健康度质差根因统计分布。
· 问题
展示设备、网络、协议、Overlay、业务的所选时间段内问题总数,以及当前问题的紧急、严重、一般个数。
· Leaf上行链路利用率Top5
通过柱状图展示所选时间段内,系统中Leaf上行链路利用率最高的5个Leaf链路。
· AP信道利用率Top5
通过柱状图展示所选时间段内,系统中AP信道利用率最高的5个AP设备。
· AP流量Top5
通过柱状图展示所选时间段内,系统中AP流量最大的5个AP设备。
· 用户上线失败Top5
通过柱状图展示所选时间段内,系统中发生上线失败次数最多的5个终端。
· 应用流量排名Top5
通过列表展示所选时间段内,系统中应用产生流量最大的5个应用信息。
表3-1 参数说明
参数 |
说明 |
应用 |
应用名称 |
应用类别 |
应用所属于哪个类别 |
总流量 |
访问该应用的总流量 |
上行流量 |
访问该应用的上行流量 |
下行流量 |
访问该应用的下行流量 |
QOS |
服务质量 |
· 应用体验质差排名Top5
通过列表展示所选时间段内,系统中应用体验质差最高的5个应用信息。
表3-2 参数说明
参数 |
说明 |
应用 |
应用名称 |
时延 |
该应用的时延值。时延为TCP三次握手的时间,也叫往返时间 |
抖动 |
该应用的抖动值 |
丢包 |
该应用的丢包占比 |
QOS |
服务质量 |
· 设备质差区域Top5
通过列表展示所选时间段内,系统中设备质差最高的5个区域信息。
表3-3 参数说明
参数 |
说明 |
区域名称 |
区域名称 |
区域标签 |
区域标签 |
最新网络健康度 |
该区域的最新网络健康度 |
网络健康度范围 |
所选时间内网络健康度区间,最小健康度到最大健康度 |
Leaf |
Leaf设备的平均健康度 |
Spine |
Spine设备的平均健康度 |
Transit |
Transit设备的平均健康度 |
Core |
Core设备的平均健康度 |
路由器 |
路由器设备的平均健康度 |
AP |
AP设备的平均健康度 |
Other |
其他设备的平均健康度 |
设备总数 |
该区域内的设备连接个数 |
· 用户质差区域Top5
通过列表展示所选时间段内,系统中有线、无线用户质差最高的5个区域信息。
表3-4 参数说明
参数 |
说明 |
区域名称 |
区域名称 |
区域标签 |
区域标签 |
最新有线健康度 |
最新时间的有线用户健康度平均值 |
有线健康度范围 |
所选时间内有线用户健康度区间,最小健康度到最大健康度 |
最新无线健康度 |
最新时间的无线用户健康度平均值 |
无线健康度范围 |
所选时间内无线用户健康度区间,最小健康度到最大健康度 |
用户总数 |
该区域内的用户连接个数 |
· 拓扑分区域展示:在拓扑界面左上角,下拉列表中可以选择不同区域名,拓扑中展示相应区域中的设备拓扑。
· 设备搜索框:在拓扑界面右上角,搜索框中可以按IP/MAC搜索当前拓扑图中所有网络设备(如交换机、路由器、AP等)。 被搜索设备会在拓扑图中绿色边框高亮显示。
· 物理拓扑:展示当前系统中所有网络设备(如交换机、路由器、AP等)的逻辑连接关系,通过使用拓扑图的方式直观的展示。 拓扑数据获取完成后, 将鼠标悬停在网络设备或链路上时,可在弹窗中查看该设备或链路的各项指标信息, 点击设备弹窗中的<查看详情>,可跳转至该设备的设备详情页面。点击链路弹窗中的<查看详情>,可跳转至该链路的链路详情页面。
¡ 放大拓扑: 单击拓扑图右下角的图标,即可将拓扑图进行放大。
¡ 缩小拓扑:单击拓扑图右下角的图标,即可将拓扑图进行缩小。
¡ 聚焦还原:单击拓扑图右下角的图标,即可将拓扑图大小还原到最初状态。
¡ 自适应屏幕:单击拓扑图右下角的图标,即可将拓扑图屏幕中自适应。
¡ 水平对齐:单击拓扑图右下角的图标,即可将设备水平对齐排列(需要选中设备才能进行横向间距的调整)。
¡ 自动分层布局:单击拓扑图右下角的图标,即可将设备自动分成不同层布局。
¡ 按角色分层:单击拓扑图右下角的图标,即可按照不同设备角色进行排列布局。
¡ 获取拓扑:单击拓扑图右下角的图标即可立即获取拓扑,间隔30秒后才能重新获取拓扑。
¡ 流量热图:单击拓扑图右下角的即可关闭热图功能,默认开启状态,当链路的带宽利用率超过设置的二级阈值时呈现橙色,超过一级阈值的时候呈现红色。
¡ 配置:单击拓扑图右下角的图标,即可配置流量热图功能的多级阈值。
¡ 保存拓扑:拖动拓扑图中的网络设备后,单击拓扑图右上角的图标,即可保存当前拓扑的相对位置。
¡ 拓扑链路状态:界面左下角,如图,显示链路不同情况的状态。
¡ 拓扑中悬浮的设备详情信息数据取自最新一分钟的数据,设备信息页面中的趋势图,按照5分钟间隔取数据
以地图形式展示地理区域的信息,将区域信息以点的形式在地图上直观的呈现。
· 网络设备健康度百分比:点击后跳转到对应区域的网络健康度页面。
· 在楼层区域下可以上传楼层图片,并且可以将AP资产布放到楼层图片上。
· 在站点区域下可以上传站点图片,并且可以将楼宇区域布放到站点图片上。
获取是否添加分析组件 来显示全部区域/本地区域
· 本地区域
列表模式:以列表形式展示区域的用户健康度信息和网络设备健康度信息。
· 全部区域
¡ 最新健康度区域数量分布图:展示最新网络健康度、最新有线用户健康度和最新无线用户健康度在0%~39%、40%~79%和80%~100%健康度范围内的最近子区域的数量。
¡ 网络健康度状况:展示所有添加在数据源管理中的分析组件管理的所有外部区域以及本地区域的网络健康度状况信息。
¡ 用户健康度状况:展示所有添加在数据源管理中的分析组件管理的所有外部区域以及本地区域的用户健康度状况信息。
¡ 问题统计:展示所有添加在数据源管理中的分析组件管理的所有外部区域以及本地区域的未关闭的问题统计数量信息。
¡ 问题列表:展示所有添加在数据源管理中的分析组件管理的所有外部区域以及本地区域的未关闭的问题列表信息。
¡ 同步频率:指后台定时更新健康度信息和问题信息的频率。
¡ 立即同步:立即更新当前时间段的健康度信息和问题信息。
无线质量展示了用户网络体验质量的整体评估结果,基于上线成功率、上线耗时、覆盖、漫游达标率、容量健康度、吞吐达标率、无线设备在服率建立7大类指标监控体系支持对各类子指标钻取进入二级页面进行问题发现和分析,清晰判断网络质量。
· 健康度
根据上线成功率、上线耗时、覆盖、漫游达标率、容量健康度、吞吐达标率、无线设备在服率7个指标的评分计算出一个全网的健康度分数。
· 体系整体达标率
用折线图展示用户在所选时间段内指标整体达标率的趋势,并显示当前时间段内指标达标率的最小值、最大值、及平均值。
表3-5 参数说明
参数 |
说明 |
最新值 |
左边七边形图,取最新时刻七个指标中非空指标的均值 |
指标趋势 |
反映体系整体达标率在所选时间范围内的变化趋势,同样取七个指标中非空指标的均值 |
平均值 |
取指标趋势的平均值 |
最大值 |
取指标趋势的最大值 |
最小值 |
取指标趋势的最小值 |
· 上线成功率
展示在所选时间段结束时间时的综合上线成功率、关联成功率、认证成功率和IP获取成功率
趋势:上线成功率综合值的变化趋势。
表3-6 参数说明
参数 |
说明 |
上线成功率 |
上线时关联和认证均成功的比例 |
· 上线耗时
展示在所选时间段结束时间时的上线耗时综合值、关联耗时、认证耗时、IP获取耗时。
趋势:上线耗时综合值的变化趋势。
表3-7 参数说明
参数 |
说明 |
上线耗时 |
关联耗时、认证耗时、DHCP耗时的总和 |
· 漫游达标率
展示在所选时间段结束时间时的漫游达标率综合值、漫游成功率、漫游耗时。
趋势:漫游达标率综合值的趋势。
表3-8 参数说明
参数 |
说明 |
漫游达标率 |
漫游成功且耗时小于3000毫秒的比例 |
· 覆盖
展示在所选时间段结束时间时的覆盖类综合值、信号强度达标率。
趋势:覆盖类综合值的趋势。
表3-9 参数说明
参数 |
说明 |
覆盖类综合值 |
等同于信号强度达标率 |
· 容量健康度
展示所选时间段结束时间时的容量健康度综合值、信道利用率达标率、用户数达标率。
趋势:容量健康度综合值的趋势。
表3-10 参数说明
参数 |
说明 |
容量健康度 |
取利用率达标率、用户数达标率两者的较小值 |
· 吞吐达标率
展示所选时间段结束时间时的吞吐达标率综合值、空口拥塞达标率、干扰达标率。
趋势:吞吐达标率综合值的趋势。
表3-11 参数说明
参数 |
说明 |
吞吐达标率 |
取空口拥塞达标率、干扰达标率两者的较小值 |
· 无线设备在服率
展示所选时间段结束时间时的无线设备在服率综合值、无线设备在服率。
趋势:无线设备在服率综合值的趋势。
表3-12 参数说明
参数 |
说明 |
无线设备在服率 |
在线AP的比例 |
指标详情页展示某个指标的统计信息和关联问题以及相关异常事件的分布。默认展示最近24小时内的数据,可以通过左上方的时间选择器来调整时间范围。
· 指标变化趋势
展示该指标在时间选择器在所选时间的变化趋势。
· 指标占比分布
展示该指标在各个区间值的分布情况。
· 发生问题统计
展示与该指标相关的问题列表,点击问题可以跳转到问题中心对应问题的详情页面。
· 异常分析
从多个维度(异常AP、AP型号、SSID、异常原因、异常终端、DHCP服务器、异常射频、频段)统计对应异常事件的次数,单击后展示对应异常分析详情。
· 事件列表
展示与异常分析维度对应的异常事件列表。
· 影响时段
展示与异常分析维度对应的受问题影响时段。
· AP在线离线对比
¡ 最新:通过环形图展示所选时间段内结束时间的AP在线离线对比,即:系统中在线AP和离线AP的数量对比。
¡ 趋势:通过折线图中的两条折线来分别展示所选时间段内在线AP和离线AP的数量随时间变化的趋势。
· AP信道利用率分布
¡ 最新:通过环形图展示所选时间段内结束时间信道利用率<=50%,50%-80%,>=80%的AP信道数量。
¡ 趋势:通过折线图展示所选时间段内信道利用率<=50%,50%-80%,>=80%的AP信道数量变化趋势。
· AP连接终端数Top10
¡ 最新:通过柱状图展示所选时间段内结束时间的AP连接终端数,即系统中连接终端最多的AP前10名。
· AP用户上线失败
¡ 最新:通过柱状图展示系统中发生上线失败次数最多的50/100AP。通过右上角的下拉框可以选择显示的数量。
· AP上下行流速Top10
¡ 最新:通过柱状图展示所选时间段结束时间的AP上下行流速,即系统中上行和下行流速最快的10个AP。
· 质量较差AP Top10
¡ 最新:通过柱状图展示所选时间段结束时间的质量较差AP Top10,即连接质量差的用户个数排名前10的AP。
展示了AP离线的信息统计,只支持查看最近7天内的AP离线信息。
必须安装Campus_Cloudnet组件才可使用AP离线统计功能
· AP离线原因
¡ 显示近7天AP离线原因及由于该原因使AP离线的次数。
¡ 点击AP离线原因柱状图中某一日期的柱状条,在AP离线明细列表处查看当日所有离线AP信息。
· AP离线次数
¡ 显示近7天离线一定次数的AP的数量
¡ 点击AP离线次数柱状图中某一日期的柱状条,在AP离线明细列表处查看当日所有离线AP信息。
· AP离线明细
¡ 显示近7天内指定日期中AP的离线详情。
¡ 点击<导出> 按钮可将指定日期的AP离线明细数据以电子表单的形式进行汇总并压缩后,保存到本地。
¡ 点击AP离线明细列表中的AP名称可进入AP的详情页面。
¡ 点击AP关联的AC设备的名称可进入AC的详情页面。
· AP离线原因汇总
¡ 点击AP离线原因柱状图中某一日期的柱状条,查看当日所有离线AP按离线原因汇总信息。
¡ 点击<导出>按钮可将可将AP离线原因汇总列表以电子表单的形式进行汇总保存到本地。
¡ 点击AP离线原因汇总列表中的AP名称可进入AP的详情页面。
· AP离线次数汇总
¡ 点击AP离线次数柱状图中某一日期的柱状条,查看当日所有离线AP按离线次数汇总信息。
¡ 点击<导出>按钮可将AP离线次数汇总列表以电子表单的形式进行汇总保存到本地。
¡ 点击AP离线次数列表中的AP名称可进入AP的详情页面。
· 概览统计
展示所选时间段区域内的AP、AC等网络设备产生的应用流量的统计数据。
· 应用健康度
展示所选区域和时间段内【智能识别应用】和【自定义应用】类型下应用健康级别为【好】【一般】【差】的数量,及健康度为【好】的应用在对应类型应用中所占的百分比。
a. 智能识别应用:无线DPI应用分析功能智能识别的应用。
b. 自定义应用:在[全局配置/应用配置]中自定义的应用。
c. 健康度级别分类:QOS介于4~5之间(包含4和5)表示【好】,介于3~4之间(包含3)表示【一般】,小于3则为【差】。
· 健康度趋势
展示所选区域和时间段内【智能识别应用】和【自定义应用】应用健康度为"好"的百分比趋势折线图,反映出网络中所有应用健康度的整体趋势。
· 应用列表
展示所选区域和时间段内产生的应用详情以及应用的基本信息,包括应用名称、类型、流量统计、时延、抖动、丢包、QOS等。单击智能识别应用或自定义应用的应用名称跳转到相应应用的流量和质量分析页面。
参数 |
说明 |
应用类型 |
· 智能识别应用:无线DPI应用分析功能智能识别的应用 · 自定义应用:在[全局配置/应用配置]中自定义的应用 · 未知应用:不能识别的应用 |
流量数据 |
展示应用总流量,下行流量和上行流量 |
抖动 |
主要展示该设备在选取时间段内的最大、最小及平均抖动趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的最大、最小及平均抖动值。通过设置阈值更新劣化时间比并进行沿用,可通过重置按钮恢复参考阈值(30ms)。劣化时间比:平均抖动值大于阈值对应的时间/全部平均抖动值对应的时间 |
丢包率 |
主要展示该设备在选取时间段内的丢包率,劣化时间比:丢包率大于阈值对应的时间/全部丢包率对应的时间 |
时延 |
展示应用所选时间段内的时延数据 |
QOS |
展示应用在所选时间内最新的应用质量评价数据,该值越高表明应用质量越好 |
音视频质量分析功能通过监控客户端、服务器、媒体网关等接入的网络设备上音视频流量质量,针对频发的丢包、抖动变大等设备,结合设备健康度等指标及时发现网络问题并通过网络扩容或者寻求音视频方案提供商等手段来保障音视频流量质量。
图3-1 音视频质量分析
· MOS分布
展示所选时间段内音视频应用产生的会话质量指标MOS值分布范围占比。
· 会话统计
展示所选时间段内音视频应用产生会话的建链成功数、建链失败数以及链接关闭数。
· 流量趋势图
展示所选时间段内音视频会话的总流量趋势图。通过列表展示所选时间段内产生会话的详情信息。包括会话交互双方IP、端口、会话起止时间、当前会话状态以及会话上下行MOS值等。可以通过点击“详情”下钻到会话详情页面。
· 会话详情
音视频会话详情页面主要展示会话基本信息,质量概述,质量分析以及路径描述。质量分析仪表盘中点击相关性分析,可以下钻到“相关性分析”页面。路径描述在选取时间段内展示该会话的上下行节点性能指标以及质量分析,指标包括MOS值、抖动、乱序率、丢包率、最长连续丢包数、字节速率、包速率。
表3-13 参数说明
参数 |
说明 |
路径描述 |
绘制了该条会话从发起方到响应方的整条链路拓扑情况,可以看到会话经过的交换机、路由器、AP等设备。可以通过选择全部、上行、下行等分别展示全局拓扑、上行拓扑、下行拓扑。可以下拉选择某台设备的名称展示该台设备对应的详情信息。可以通过双击设备图标下钻到设备详情页面。 |
MOS |
主要展示该会话在选取时间段内的MOS趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的MOS值。通过设置阈值更新劣化时间比并进行沿用,可通过重置按钮恢复参考阈值(4)。劣化时间比:MOS值小于阈值对应的时间/全部MOS值对应的时间。 |
抖动 |
主要展示该会话在选取时间段内的最大、最小及平均抖动趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的最大、最小及平均抖动值。通过设置阈值更新劣化时间比并进行沿用,可通过重置按钮恢复参考阈值(30ms)。劣化时间比:平均抖动值大于阈值对应的时间/全部平均抖动值对应的时间。 |
乱序率 |
主要展示该会话在选取时间段内的乱序率趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的乱序率值。通过设置阈值更新劣化时间比并进行沿用,可通过重置按钮恢复参考阈值(1%)。劣化时间比:乱序率大于阈值对应的时间/全部乱序率对应的时间。 |
丢包率 |
主要展示该会话在选取时间段内的丢包率趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的丢包率值。通过设置阈值更新劣化时间比并进行沿用,可通过重置按钮恢复参考阈值(1%)。劣化时间比:丢包率大于阈值对应的时间/全部丢包率对应的时间。 |
最长连续丢包数 |
主要展示该会话在选取时间段内的最长连续丢包数趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的最长连续丢包数值。通过设置阈值更新劣化时间比并进行沿用,可通过重置按钮恢复参考阈值(3个)。劣化时间比:最长连续丢包数大于阈值对应的时间/全部最长连续丢包数对应的时间。 |
字节速率 |
主要展示该会话在选取时间段内的字节速率趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的字节速率值。 |
包速率 |
主要展示该会话在选取时间段内的包速率趋势图。当鼠标悬停在折线某处时,折线图上将会展示该时间点的包速率值。 |
网络健康度页面包含概览、设备、单板、芯片、接口、队列、光模块、链路、PoE、AC、AP、ONU等页签,展示网络设备的整体健康状况趋势、当前网络设备状况和当前系统中的网络设备列表。默认展示最近24小时内的健康状况变化趋势,可以通过页面左上方的时间选择器来调整时间范围。
图3-2 健康度概览
· 区域配置
单击页面左上角区域选择组件,可以选择所有区域,对应地理区域,对应逻辑区域,选定后会展示选定区域的数据。
· 时间配置
单击页面左上角时间选择组件,可选择最近3小时,最近24小时,最近7天或者自定义时间范围。默认展示最近24小时内的健康状况变化趋势,可以通过页面左上方的时间选择器来调整时间范围,选定后会展示该时间范围内的数据。
· 健康度趋势
通过折线图的方式展示在所选时间段内网络设备健康情况的变化趋势。有以下三种选择时间段的方式:
¡ 在左上方的时间选择框选择;
¡ 鼠标双击图表区域可选择该时间点的前一小时;
¡ 鼠标在图表区域拖动选择时间范围。
· 网络健康
¡ 最新:展示所选时间段结束时间的网络健康状况,包括所有设备的健康度、在线设备数量、健康设备数、离线设备数、不同类型设备的个数以及对应的健康状况。
¡ 趋势:用折线图的形式分别展示所选时间段内网络中设备的健康情况。每个折线图分别用好、一般、差、离线4条折线展示不同健康情况的设备数量的变化趋势。
· 健康度质差根因分布
通过环形图展示所选时间段结束时间影响网络中有线/无线设备健康度分数原因的设备数量分布,点击环上原因可以联动具体影响的设备列表。
· 网络设备登录次数分布
展示所选时间段内网络设备登录成功和失败次数的分布。
· 网络设备列表
展示系统中所有网络设备的设备名称、系统名称、设备类型、IP地址、设备型号、软件版本、健康度、质差根因、异常分析数、事件分析数、在线状况。单击列表上方的类型和健康度评分可对列表进行筛选,单击列表右上角的"导出" 按钮可以将列表导出,单击列表中的设备名称可跳转至该设备的设备详情页面。
· 问题分析
¡ 异常分析
- 严重级别:问题严重级别,包括紧急、严重、一般、告警、提示。
- 名称:故障的名称。
- 故障对象:发生故障的设备、端口、槽位、芯片、链路等对象。
- 事件状态:故障的解决状态,未恢复表示故障未解决,已隔离表示已在控制组件上下发隔离型预案,已恢复表示该故障已解决。
- 问题现象状态:当前故障的存在状态。
- 开始时间:故障发生的时间。
- 结束时间:故障结束的时间。
- 持续时间:当前问题列表的持续时间为,若事件状态为已恢复,持续时间为故障从发生到结束的时间,否则为从发生至当前的时间。历史问题列表的持续时间为,故障已恢复,那持续时间为故障发生到结束的时间,故障未恢复,持续时间是发生到处理故障的时间。
- 操作:跳转至异常分析当前问题列表对应的问题。
¡ 事件分析
展示所选时间段内,设备发生问题的情况。可以根据类型、子类型、设备名称对列表数据进行筛选。可以根据问题名称进行模糊搜索。右侧过滤的操作是基于选项进行搜索过滤。右侧导出按钮可将问题列表导出至.xlsx形式。
· 端口队列缓存
本功能统计的队列以及接口数据是由BufferMonitor解析任务上报的,需要设备配置BufferMonitor后才能被统计到。
¡ 丢包原因分布统计:展示页面选定时间范围的丢包原因统计,支持与右侧趋势图联动展示过去任意时间点的丢包情况
¡ 丢包原因分布历史趋势:展示选定时间范围内全网丢包原因分布变化趋势,支持选择某一过去时间点联动下方图表展示过去时刻的统计和Top100情况
¡ 拥塞端口分布统计:展示选定时间范围的最新状态为拥塞的端口数统计,支持与右侧趋势图联动查看过去任意时间点的拥塞端口数
¡ 拥塞端口分布历史趋势:展示选定时间范围内全网拥塞端口数变化趋势,支持选择某一过去时间点联动下方图表展示过去时刻的统计和Top100情况
¡ 端口丢包Top100 :展示选定时间范围内丢包数排名前100的端口,支持与丢包原因分布历史趋势和拥塞端口分布历史趋势联动展示。
¡ 队列缓存使用Top100 :展示选定时间范围内缓存使用状态排名前100的队列,支持与丢包原因分布历史趋势和拥塞端口分布历史趋势联动展示。
从CPU利用率、内存利用率、温度三个维度去展示设备的网络健康度。
图3-3 设备健康度
· 区域配置
单击页面左上角区域选择组件,可以选择所有区域,对应地理区域,对应逻辑区域,选定后会展示选定区域的数据。
· 时间配置
单击页面左上角时间选择组件,可选择最近3小时,最近24小时,最近7天或者自定义时间范围。默认展示最近24小时内的健康状况变化趋势,可以通过页面左上方的时间选择器来调整时间范围,选定后会展示该时间范围内的数据。
· 指标分布
展示选定时间段内,特定指标发生超限告警的设备与正常设备的数量的最新分布情况,单击右侧趋势图中坐标轴的历史时间点可以与环形分布图联动,展示该历史时间点超限设备与正常设备数量占比。左上下拉框可选择CPU利用率、内存利用率、温度。单击趋势图中的历史时间点可以与左侧环形分布图联动,展示该历史时间点超限设备与正常设备数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/谷值/均值/最新值(若存在)等数据的Top50面积图。
¡ 超限次数:展示选定时间段内选定指标的设备超限次数Top50面积图。
· 设备-CPU利用率分布趋势图
展示选定时间段内,特定指标发生超限告警的设备与正常设备的数量的分布情况趋势图,单击趋势图中坐标轴的历史时间点可以与左侧环形分布图联动,展示该历史时间点超限设备与正常设备数量占比。
· 设备指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标和超限情况趋势图,图中不同颜色曲线代表不同超限情况。单击趋势图右上角齿轮型图标,弹出“设置超限检测参数”对话框,在对话框中可配置静态门限和动态基线异常检测参数,具体参数解释可参考参数说明表格。
左上方的指标趋势下拉框可选择CPU利用率、内存利用率、温度,右上角的搜索框可以根据设备名称或IP进行搜索,齿轮配置按钮可以对列表展示栏CPU利用率、内存利用率、温度进行是否展示。单击设备名称链接会跳转至设备详情页。
静态阈值和动态基线异常检测参数设定:
¡ 检测方向:根据检测方向,若选择上限,则数据高于静态上限值,发生超限;若选择下限,则数据低于静态下限值,发生超限;若选择上限/下限,则数据高于静态上限值或低于静态下限值,发生超限。
¡ 静态上限:静态检测时的上限值。
¡ 静态下限:静态检测时的下限值。
¡ 连续次数:当连续出现指定次数的超过动态基线或者静态门限产生一次超限告警。
¡ 当前对象:选择运用到当前对象,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有对象:选择运用到所有对象,则该项指标的静态门限设定或动态基线设定会被运用到该页签下所有对象的该指标。
¡ 当前指标:选择运用到当前指标,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有指标:选择运用到所有指标,则该项指标的静态门限设定或动态基线设定会被运用到所有页签下的所有对象的所有。
¡ 基线偏移量:用于判定指标数据是否超出预测数据的动态基线告警上下界值,基线告警上界值=预测上界值+基线偏移量;基线告警下界值=预测下界值-基线偏移量。
¡ 高位异常水位线:用于判定指标数据是否进行动态基线检测的上界阈值。
¡ 低位异常水位线:用于判定指标数据是否进行动态基线检测的下界阈值。
· 区域配置
单击页面左上角区域选择组件,可以选择所有区域,对应地理区域,对应逻辑区域,选定后会展示选定区域的数据。
· 时间配置
单击页面左上角时间选择组件,可选择最近3小时,最近24小时,最近7天或者自定义时间范围。默认展示最近24小时内的健康状况变化趋势,可以通过页面左上方的时间选择器来调整时间范围,选定后会展示该时间范围内的数据。
· 指标分布
展示选定时间段内,特定的指标发生超限告警的设备单板与正常设备单板的数量的最新分布情况统计图和分布情况趋势图。左上下拉框可选择CPU利用率、内存利用率、温度。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限设备单板与正常设备单板数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/谷值/均值/最新值(若存在)等数据的Top50面积图。
¡ 超限次数:展示选定时间段内选定指标的设备单板超限次数Top50面积图。
· 单板指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标和超限情况趋势图。单击趋势图右上方设置图标可配置指标的静态门限和动态基线异常检测(若支持)相关参数。
左上方的指标趋势下拉框可选择CPU利用率、内存利用率、温度,右上角的搜索框可以根据设备名称或IP进行搜索,齿轮配置按钮可以对列表展示栏CPU利用率、内存利用率、温度进行是否展示。单击设备名称链接会跳转至设备详情页。
静态阈值和动态基线异常检测参数设定:
¡ 检测方向:根据检测方向,若选择上限,则数据高于静态上限值,发生超限;若选择下限,则数据低于静态下限值,发生超限;若选择上限/下限,则数据高于静态上限值或低于静态下限值,发生超限。
¡ 静态上限:静态检测时的上限值。
¡ 静态下限:静态检测时的下限值。
¡ 连续次数:当连续出现指定次数的超过动态基线或者静态门限产生一次超限告警。
¡ 当前对象:选择运用到当前对象,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有对象:选择运用到所有对象,则该项指标的静态门限设定或动态基线设定会被运用到该页签下所有对象的该指标。
¡ 当前指标:选择运用到当前指标,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有指标: 选择运用到所有指标,则该项指标的静态门限设定或动态基线设定会被运用到所有页签下的所有对象的所有。
¡ 基线偏移量:用于判定指标数据是否超出预测数据的动态基线告警上下界值,基线告警上界值=预测上界值+基线偏移量;基线告警下界值=预测下界值-基线偏移量。
¡ 高位异常水位线:用于判定指标数据是否进行动态基线检测的上界阈值。
¡ 低位异常水位线:用于判定指标数据是否进行动态基线检测的下界阈值。
· 区域配置
单击页面左上角区域选择组件,可以选择所有区域,对应地理区域,对应逻辑区域,选定后会展示选定区域的数据。
· 时间配置
单击页面左上角时间选择组件,可选择最近3小时,最近24小时,最近7天或者自定义时间范围。默认展示最近24小时内的健康状况变化趋势,可以通过页面左上方的时间选择器来调整时间范围,选定后会展示该时间范围内的数据。
· 指标分布
展示选定时间段内,特定的指标发生超限告警的设备芯片与正常设备芯片的数量的最新分布情况统计图和分布情况趋势图。左上下拉框可选择各项资源信息。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限设备芯片与正常设备芯片数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/谷值/均值/最新值(若存在)等数据的Top50面积图。
¡ 超限次数:展示选定时间段内选定指标的设备芯片超限次数Top50面积图。
· 芯片指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标和超限情况趋势图。单击趋势图右上方设置图标可配置指标的静态门限和动态基线异常检测(若支持)相关参数。
左上方的指标趋势下拉框可选择各项资源指标,右上角的搜索框可以根据设备名称或IP进行搜索,齿轮配置按钮可以对列表展示栏各项资源进行是否展示。单击设备名称链接会跳转至设备详情页。
静态阈值和动态基线异常检测参数设定:
¡ 检测方向:根据检测方向,若选择上限,则数据高于静态上限值,发生超限;若选择下限,则数据低于静态下限值,发生超限;若选择上限/下限,则数据高于静态上限值或低于静态下限值,发生超限。
¡ 静态上限:静态检测时的上限值。
¡ 静态下限:静态检测时的下限值。
¡ 连续次数:当连续出现指定次数的超过动态基线或者静态门限产生一次超限告警。
¡ 当前对象:选择运用到当前对象,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有对象:选择运用到所有对象,则该项指标的静态门限设定或动态基线设定会被运用到该页签下所有对象的该指标。
¡ 当前指标:选择运用到当前指标,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有指标:选择运用到所有指标,则该项指标的静态门限设定或动态基线设定会被运用到所有页签下的所有对象的所有。
¡ 基线偏移量:用于判定指标数据是否超出预测数据的动态基线告警上下界值,基线告警上界值=预测上界值+基线偏移量;基线告警下界值=预测下界值-基线偏移量。
¡ 高位异常水位线:用于判定指标数据是否进行动态基线检测的上界阈值。
¡ 低位异常水位线:用于判定指标数据是否进行动态基线检测的下界阈值。
· 区域配置
单击页面左上角区域选择组件,可以选择所有区域,对应地理区域,对应逻辑区域,选定后会展示选定区域的数据。
· 时间配置
单击页面左上角时间选择组件,可选择最近3小时,最近24小时,最近7天或者自定义时间范围。默认展示最近24小时内的健康状况变化趋势,可以通过页面左上方的时间选择器来调整时间范围,选定后会展示该时间范围内的数据。
· 指标分布
展示选定时间段内,特定的指标发生超限告警的设备接口与正常设备接口数量的最新分布情况统计图和分布情况趋势图。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限设备接口与正常设备接口数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/谷值/均值/最新值(若存在)等数据的Top50面积图。
· 接口指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图。指标包含:CRC错误数,ECN报文数,WRED丢包数,发送丢包数,发送丢包率,发送包数,发送包速率,发送单播包数,发送字节数,发送字节速率,发送带宽占用率,发送广播包数,发送组播包数,发送错包数,发送错包率,接收丢包数,接收丢包率,接收包数,接收包速率,接收单播包数,接收字节数,接收字节速率,接收带宽占用率,接收广播包数,接收组播包数,接收缓存不足丢弃字节数,接收缓存不足丢弃报文数,接收错包数,接收错包率。
左上方的指标趋势下拉框可选择各指标趋势,右上角的搜索框可以根据设备名称或IP进行搜索,齿轮配置按钮可以对列表展示栏各项进行是否展示。单击设备名称链接会跳转至设备详情页。
¡ 丢包反映的是非正常转发报文的全部统计,部分报文仅被标识为不能正常转发,并没有被丢弃。
· 指标分布
展示选定时间段内,特定的指标发生超限告警的设备接口队列与正常设备接口队列数量的最新分布情况统计图和分布情况趋势图。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限设备接口队列与正常设备接口队列数量占比。
· 实际数值:展示选定时间段内选定指标的峰值/谷值/均值/最新值(若存在)等数据的Top50面积图。
· 队列-指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图和超限情况趋势图(若支持)。单击趋势图右上方设置图标可配置指标的静态阈值和动态基线异常检测(若支持)相关参数。
· 队列-配置变化列表
列表展示队列门限配置的最新状态,表中每行支持向下展开展示各门限配置的趋势图。
· 健康度评估
¡ 用户可以通过页面左上方的时间选择器来调整健康度评估的时间范围。
¡ 光模块健康级别统计趋势:展示所选时间光模块健康级别数目分布(默认24小时)。
¡ 光模块健康级别最新分布:展示结束时间光模块健康级别数目分布(默认今天)。
¡ 健康度Top10:展示结束时间光模块各个健康级别的Top10接口索引名称(默认今天)。
¡ 光模块健康度详情:展示结束时间所有光模块运行信息(默认今天),单击设备名称,可查看光模块详情。
当光模块运行状态为down时,不统计健康度信息。
· 故障概率预测
¡ 光模块数量统计:按光模块类型展示当天AI预测时采集到的在网光模块数量分布。
¡ 光模块故障数量预测:展示未来一周和未来一月各类型光模块故障数量的预测值。
¡ 光模块故障预测详情:按照生产时间、类型展示未来一周和未来一月光模块故障数量的预测值。
· 光链路
¡ 指标分布:展示选定时间段内,特定的指标发生超限的光链路与正常光链路的数量的最新分布情况统计图和分布情况趋势图。单击趋势图中的历史时间点可以与左侧环形分布图联动,展示该历史时间点超限光链路与正常光链路数量占比。
¡ 光模块光衰-指标趋势列表:列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图和超限情况趋势图。单击趋势图右上方设置图标可配置指标的超限检测相关参数。
注:上行光衰是指从源到目的的光衰,下行光衰是指从目的到源的光衰。
¡ 光衰偏差超限检测参数设定:
- 特定对象:选择运用到特定对象,则该项指标的光衰偏差会被运用到用户选择设定的对象的该指标。
- 所有对象:选择运用到所有对象,则该项指标的光衰偏差会被运用到该页签下所有对象的该指标。
注:光衰偏差超限检测参数配置后,将应用到光链路光衰超限的计算中,光链路列表中展示的偏差为当时配置的数值。
· 光模块详情
¡ 光模块信息:展示所选光模块的详细信息。包括厂商、设备名称、生产日期等。
¡ 光模块状态趋势:展示所选时间段内,光模块的健康度趋势、发送光功率趋势、偏置电流趋势、接收光功率趋势、电压趋势及温度趋势。
当光模块运行状态为down时,不统计健康度信息。
· 物理链路
¡ 指标分布: 展示选定时间段内,特定的指标发生超限告警的物理链路与正常物理链路数量的最新分布情况统计图和分布情况趋势图。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限物理链路与正常物理链路数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/谷值/均值/最新值(若存在)等数据的Top50面积图。
¡ 物理链路指标趋势列表:列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图。类型选择出口链路,可筛选出出口链路的列表。勾选链路的出口链路,可将该链路设置为出口链路;勾选AI预测状态,可开启对应链路的AI预测。
¡ 点击列表右上角的齿轮图标,可配置低利用率告警阈值、高利用率告警阈值、AI预测时长。当链路利用率高于高利用率告警阀值时将会在[诊断分析/事件分析]中出现问题告警。AI预测计算出的AI预测利用率若高于高利用率告警阈值或低于低利用率告警阈值,分别会在[诊断分析/事件分析]中给出相应的链路扩容建议或缩容建议。AI预测时长指预测要生成的预测时长的数据,默认为3天,即预测未来3天的数据。
¡ 指标趋势选择上下行速率时,展开的指标趋势图还可展示IPv4速率和IPv6速率,可在趋势图左上角单击蓝色链接选择切换。选择上下行速率或上下行带宽利用率时,若开启预测,展开的趋势指标图还会展示对应指标的预测趋势图。
¡ 上下行速率或上下行带宽利用率趋势图可选择1分钟、5分钟、1小时时间粒度。查询最近2天内的数据可选择1分钟粒度或5分钟粒度或1小时粒度。查询最近2天至7天内的数据可选择5分钟或1小时粒度。查询最近7天外的数据(不论时间跨度集周期不大于1分钟,建议最小使用1分钟时间粒度查看;采集周期大于1分钟,建议最小使用5分钟时间粒度查看。
¡ 勾选链路上下行利用率或上下行速率趋势图右上的“对比分析”勾选框,可选择其它至多4条链路的趋势图数据一同展示在链路利用率趋势图中进行对比。在趋势图右上角可选择展示最新、最大、最小、平均值的趋势图(最新代表每个时间点时大、最小、平均值时建议选择展示时间粒度为5分钟或1小时。
¡ 容量规划:可设置链路不同层级的阈值,并展示链路利用率处于不同级别的时间占比。
· PoE功率TOP10
通过柱状图展示所选时间段结束时间的PoE消耗功率Top10。
· PSE剩余保证功率Top10
通过柱状图展示所选时间段结束时间的PSE剩余保证功率按倒序排序Top10,其中PSE剩余保证功率=PSE最大保证功率-该PSE中优先级为Critical的接口最大功率之和(通常PSE最大保证功率=PSE最大功率)。
· PoE接口过载统计
通过柱状图展示所选时间段内各PoE接口过载数量之和。
· PoE接口短路统计
通过柱状图展示所选时间段内各PoE接口短路数量之和。
· PoE列表
列表展示系统中所有PoE的设备名称、电源索引、PSE数量、独立PoE供电、功率、PSE峰值功率和和PSE最大功率和的最新状态。单击列表中的设备名称可跳转至该设备的设备详情页面,单击列表中的操作按键可以跳转至该PoE的PSE列表。
· 指标分布
展示选定时间段内,特定的指标发生超限告警的设备PSE供电模块与正常的设备PSE供电模块数量的最新分布情况统计图和分布情况趋势图。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限设备PSE供电模块与正常设备PSE供电模块数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/均值/最新值(若存在)等数据的Top50面积图。
· PoE-PSE指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图和超限情况趋势图(若支持)。单击趋势图右上方设置图标可配置指标的静态阈值和动态基线异常检测(若支持)相关参数。
· 指标分布
展示选定时间段内,特定的指标发生超限告警的设备供电接口与正常的设备供电接口数量的最新分布情况统计图和分布情况趋势图。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限设备供电接口与正常设备供电接口数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/均值/最新值(若存在)等数据的Top50面积图。
· PoE-接口指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图和超限情况趋势图(若支持)。单击趋势图右上方设置图标可配置指标的静态阈值和动态基线异常检测(若支持)相关参数。
· 指标分布
展示选定时间段内,特定的指标发生超限告警的AC/AP与正常的AC/AP数量的最新分布情况统计图和分布情况趋势图。单击右侧趋势图中的历史时间点可以与环形分布图联动,展示该历史时间点超限AC/AP与正常AC/AP数量占比。
¡ 实际数值:展示选定时间段内选定指标的峰值/谷值/均值/最新值(若存在)等数据的Top50面积图。
¡ 超限次数:展示选定时间段内选定指标的AC/AP超限次数Top50面积图。
· AC/AP指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图和超限情况趋势图。单击趋势图右上方设置图标可配置指标的静态阈值和动态基线异常检测(若支持)相关参数。
静态阈值和动态基线异常检测参数设定:
¡ 检测方向:根据检测方向,若选择上限,则数据高于静态上限值,发生超限;若选择下限,则数据低于静态下限值,发生超限;若选择上限/下限,则数据高于静态上限值或低于静态下限值,发生超限。
¡ 静态上限:静态检测时的上限值。
¡ 静态下限:静态检测时的下限值。
¡ 连续次数:当连续出现指定次数的超过动态基线或者静态门限产生一次超限告警。
¡ 当前对象:选择运用到当前对象,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有对象:选择运用到所有对象,则该项指标的静态门限设定或动态基线设定会被运用到该页签下所有对象的该指标。
¡ 当前指标:选择运用到当前指标,则该项指标的静态门限设定或动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有指标: 选择运用到所有指标,则该项指标的静态门限设定或动态基线设定会被运用到所有页签下的所有对象的所有。
¡ 基线偏移量:用于判定指标数据是否超出预测数据的动态基线告警上下界值,基线告警上界值=预测上界值+基线偏移量;基线告警下界值=预测下界值-基线偏移量。
¡ 高位异常水位线:用于判定指标数据是否进行动态基线检测的上界阈值。
¡ 低位异常水位线:用于判定指标数据是否进行动态基线检测的下界阈值。
· 设备功耗指标趋势列表
列表展示指标数据的最新状态,表中每行支持向下展开展示各指标的趋势图和超限情况趋势图。单击趋势图右上方设置图标可配置指标的动态基线异常检测相关参数。
动态基线异常检测参数设定:
¡ 检测方向:根据检测方向,若选择上限,则数据高于基线告警上界值,发生超限;若选择下限,则数据低于基线告警下界值,发生超限;若选择上限/下限,则数据高于基线告警上界值或低于基线告警下界值,发生超限。
¡ 连续次数:当连续出现指定次数的超过动态基线产生一次超限告警。
¡ 当前对象:选择运用到当前对象,则该项指标的动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 所有对象:选择运用到所有对象,则该项指标的动态基线设定会被运用到该页签下所有对象的该指标。
¡ 当前指标:选择运用到当前指标,则该项指标的动态基线设定会被运用到用户选择设定的对象的该指标。
¡ 基线偏移量:用于判定指标数据是否超出预测数据的动态基线告警上下界值,基线告警上界值=预测上界值+预测上界值*(偏移量/100);基线告警下界值=预测下界值-预测下界值*(偏移量/100)。
¡ 高位异常水位线:用于判定指标数据是否进行动态基线检测的上界阈值。
¡ 低位异常水位线:用于判定指标数据是否进行动态基线检测的下界阈值。
ONU设备(Optical Network Unit,光网络单元):EPON系统的用户端设备,用于连接用户PC、机顶盒、交换机等,通常放置在用户家中、楼道或道路两侧,负责响应OLT发出的管理命令,并将用户数据转发到OLT。
OLT设备(Optical Line
Terminal,光线路终端):EPON系统的核心设备,一般放置在中心机房,用于统一管理ONU,并将接入业务汇聚和传递到IP网。
表3-14 参数说明
参数 |
说明 |
OLT设备名称 |
ONU设备对应的OLT设备名 |
ONU名称 |
ONU设备名称 |
ONU设备型号 |
ONU设备型号 |
ONU上行光衰 |
ONU端口发送光功率-OLT端口接收光功率,单位dBm |
ONU下行光衰 |
OLT端口发送光功率-ONU端口接收光功率,单位dBm |
ONU接收光功率 |
ONU设备接收光功率,单位dBm |
ONU发送光功率 |
ONU设备发送光功率,单位dBm |
ONU健康度 |
ONU设备健康度,好(8-10),一般(4-7),差(1-3) |
· 变更设备占比
¡ 通过环形图展示变更设备在所有设备中的占比。
· TOP10变更设备
¡ 通过横向柱状图展示以设备变更的修改行数、新增行数、删除行数为维度统计出的Top 10变更设备,单击相应颜色标签可隐藏新增行、修改行、删除行的数据。
· TOP变更项
¡ 通过横向柱状图展示发生不同变更类型的设备数的排序,并显示了发生相应变更项变更的设备数及总设备数。
¡ 单击柱状图可查看对应数据类型的变更设备名称列表。
· 网络变更历史趋势
¡ 通过柱状图展示所选时间段内历史快照数据有变化的设备数量统计结果,如果选择时间段小于等于两天,则以五分钟粒度展示,否则以一小时粒度展示。点击柱状图后下面的变更设备列表会展示所点击的时间段内变更的设备详情。
¡ 通过选择柱状图左上方的数据类型选项,可以只显示表项变更、配置变更或版本变更的历史趋势。
· 变更设备列表
¡ 支持展示系统中设备的设备名称、设备类型、IP地址、设备型号、表项变更、配置变更、版本变更和最近变更时间。
¡ 通过单击设备名称左侧的“>”图标,查看以维恩图(圆圈层叠图)展示的数据对比信息,图中左边的数字为删除的行数,中间的数字为相同的行数,右边的数字为增加的行数。单击维恩图,可查看详细对比信息。
¡ 支持根据数据类型过滤变更设备列表,数据类型分为表项、配置和软件版本,其中表项包括Route、MAC、ARP、ND、VRF、VSI、LLDP、L2VPN MAC,配置包括Running Config。单击<表项变更>按钮只展示有表项变更的设备,单击<配置变更>按钮只展示有配置变更的设备,单击<版本变更>按钮只展示有版本变更的设备。
¡ 在变更设备列表中,支持自定义比较时间,单击时间选择框选择两个对比时间点后,变更设备列表将展示该设备在两个所选时间点的数据对比结果。
¡ 支持根据设备的信息进行过滤,以及根据表项变更、配置变更、版本变更或最近变更时间进行排序。
· 变更快照对比详情
¡ 通过弹窗的形式展示设备历史快照数据的详细信息以及差异信息。
¡ 通过对比详情中的<展示所有>按钮可以查看全部的设备历史快照数据详细信息,或者只展示有差异的信息。通过单击“<<”或“>>”按钮可以快速切换对比的数据类型。通过单击“<”或“>”按钮可以快速定位到差异行。通过搜索框可对下方对比详情进行文本搜索。
¡ 底部问题列表根据变更快照对比详情中的查询时间展示对比设备的故障统计。
用户健康度概览页面展示用户整体健康状况趋势、当前终端整体情况、终端运行情况和用户列表等内容。
单击时间选择框右侧的齿轮按钮,可以对页面上的仪表盘进行移动、删除、新增等操作。单击<添加仪表>按钮,可以添加系统已内置的仪表盘。系统默认展示了用户健康度、用户列表等部分仪表盘,其它未展示的,可结合需要从仪表盘管理中添加。
健康度指标在页面右上角,此功能用来调整无线健康度算法模型中的阈值配置,以适应不同场景下不同指标的数据分布差异情况。无线健康度得分是通过综合信号强度、上行选速、下行选速、时延、丢包率、重传率6种指标信息和每个用户最近5分钟内出现过的问题进行综合计算得到,针对不同部署场景,部分指标的数据分布可能会存在一定的波动,可以通过此项功能结合历史数据进行微调。
表3-15 参数说明
参数 |
说明 |
信号强度 |
AP接收Client发送的报文,RSSI平均值 |
上行选速 |
AP空口接收Client发送的报文速率平均值,整个采集周期AP空口接收报文速率平均值 |
下行选速 |
AP空口发往Client报文的速率平均值,整个采集周期AP空口发送报文速率平均值 |
时延 |
AP空口发往Client报文时延平均值 |
丢包率 |
AP空口发往Client报文丢包率均值 |
重传率 |
AP空口发往Client报文重传率均值 |
展示所选时间段内结束时间点的无线终端和有线终端的健康度情况(健康度情况:好终端的数量占在线终端的比例。好终端的判断标准是通过终端的信号强度、时延、丢包率等十几种相关的指标,综合计算评价得出:好(8~10分)、一般(4~7分)、差(1~3分))、在线终端数、离线终端数、空闲终端数(无线),空闲终端是指上下行流量低于20KB的终端。单击用户健康度右侧齿轮按钮,可对无线终端在线数是否包含空闲终端进行选择。
用折线图展示在所选时间段内的无线终端和有线终端的健康度变化情况(健康度趋势:好终端的数量占在线终端的比例),当鼠标悬停在折线某处时,折线图的下方将会展示此时刻该终端的健康度和系统状态。单个终端健康度评价方法:好(8~10分)、一般(4~7分)、差(1~3分)。
最新:对所有无线和有线上线终端的接入时长进行统计,展示在所选时间段内,不同接入耗时(终端最新一次上线耗时)的终端数量的分布。
· 最新:展示所选时间段内结束时间点的终端信号强度(RSSI)分布。
· 趋势:通过折线图中的5条折线分别展示大于等于 - 54dBm、- 64~ - 55 dBm、- 74~ - 65 dBm、- 85~ - 75 dBm、小于等于 - 86dBm不同信号强度的终端数量随时间变化的趋势。
趋势:通过折线图展示所选时间段内,发生的终端成功接入次数和终端失败接入次数的变化趋势。
· 最新:根据SSID对所有上线终端进行数量统计,展示不同SSID的终端数量分布。
· 趋势:用折线图展示在所选时间段内,不同SSID的终端数量随时间变化的趋势。
· 最新:基于终端所在频段的情况,统计2.4GHz和5GHz频段的终端的分布。
· 趋势:用折线图展示在所选时间段内,不同频段的终端数量随时间变化的趋势。
统计:通过柱状图展示所选时间段内,发生上线失败次数最多的10个终端。可筛选有线和无线终端进行查看。
统计:展示所选时间段内上线终端总认证次数以及认证成功和认证失败的次数。
统计:展示在所选时间段内无线终端和有线终端的平均在线时长(单位小时),并通过条形图展示在线时长为小于2小时、2~6小时、大于6小时的终端数。
· 统计:展示最近5分钟或1小时(按选择范围决定粒度)的各类无线和有线终端上线成功/失败事件统计,以及所选时间范围内各类上线失败/成功事件趋势,并展示未来一天内的趋势预测和预测上下限。当所选时间范围大于30天,上线趋势展示粒度是1小时;所选时间范围小于等于30天时,展示粒度是5分钟。
· 点击趋势图可查看详细信息。
· 受影响终端:按终端维度统计终端上线失败事件,用方块图展示上线失败次数排名前50的终端。当选择受影响终端维度时,单击终端的方块可下钻到该终端的具体失败事件记录。
· 受影响设备:按设备维度统计终端上线失败事件,用方块图展示终端上线失败次数排名前50的设备。
· 单击右上角的<导出>按钮可以以用户、AP、频段为粒度导出各类失败和成功次数统计。
· 上线分析中5分钟粒度和1小时粒度的统计维度不同,因此这两种粒度计算出的失败次数预测值无关联。
对所有无线终端的终端厂商进行统计,展示在所选时间段内不同终端厂商的数量分布。
对所有无线终端的终端模式进行统计,展示在所选时间段内不同终端模式的数量分布。
展示无线用户和有线用户的用户名、IP地址、MAC地址、健康度等信息。点击列表中的用户名可跳转至该用户的用户详情页面。如果用户没有用户名,将会展示IP地址。
· 单击列表上方的健康度、参数和健康度TOP排名可对用户进行筛选。
· 单击<过滤>按钮,可通过用户名、IP、MAC地址、AP对用户进行过滤并且支持模糊查询过滤,SSID不支持模糊查询。
· 单击列表右上角的<导出>按钮可以将用户列表导出。
VIP分析页面展示VIP用户整体健康状况趋势、当前VIP终端整体情况、VIP终端运行情况以及与非VIP终端运行情况的对比和用户列表等内容。
单击时间选择框右侧的齿轮按钮,可以对页面上的仪表盘进行移动、删除、新增等操作。单击<添加仪表>按钮,可以添加系统已内置的仪表盘。
展示所选时间段内结束时间的无线VIP终端和有线VIP终端的健康度(健康终端占全部终端的比例)、在线数、离线数、空闲数(无线),空闲终端是指上下行流量低于20KB的终端。单击用户健康度右侧齿轮按钮,可对无线VIP终端在线数是否包含空闲VIP终端进行选择。
用折线图展示在所选时间段内的无线VIP终端和有线VIP终端的健康度变化情况,当鼠标悬停在折线某处时,折线图的下方将会展示此时刻该VIP终端的健康度和系统状态。健康度评价方法:好(8~10分)、一般(4~7分)、差(1~3分)。
展示VIP终端资源总数、已使用VIP终端资源数、剩余可用VIP终端资源数。
表3-16 参数说明
参数 |
说明 |
VIP终端资源总数 |
默认AC可设置128个VIP终端 |
已使用VIP终端资源数 |
AC已使用的VIP终端资源数 |
剩余可用VIP终端资源数 |
AC剩余可用VIP终端资源数 |
· 最新:展示在所选时间段结束时间的VIP终端、非VIP终端及整体的平均接入耗时。
· 趋势:通过折线图中的2条折线分别叠加展示VIP终端平均时延、VIP终端最大时延随时间变化的趋势。
· 最新:展示在所选时间段结束时间时的VIP终端、非VIP终端及整体的上/下行平均速率。
· 趋势:通过折线图中的6条折线分别叠加展示VIP终端、非VIP终端及整体的上/下行平均速率随时间变化的趋势。
· 最新:展示在所选时间段结束时间时的VIP终端、非VIP终端及整体的平均丢包率。
· 趋势:通过折线图中的2条折线分别叠加展示VIP终端、非VIP终端的平均丢包率随时间变化的趋势。
· 最新:展示所选时间段结束时间时的VIP终端信号强度(RSSI)分布。
· 趋势:通过折线图中的5条折线分别展示大于等于 - 54dBm、- 64~ - 55 dBm、- 74~ - 65 dBm、- 85~ - 75 dBm、小于等于 - 86 dBm不同信号强度的VIP终端数量随时间变化的趋势。
· 最新:根据SSID对所有上线VIP终端进行数量统计,展示不同SSID的VIP终端数量分布。
· 趋势:用折线图展示在所选时间段内,不同SSID的VIP终端数量随时间变化的趋势。
· 最新:基于系统中VIP终端所在频段的情况,统计2.4GHz和5GHz频段的终端的分布情况。
· 趋势:用折线图展示在所选时间段内,不同频段的VIP终端数量随时间变化的趋势。
以列表的形式展示VIP终端漫游类、连接类的异常事件,并且可跳转至问题中心页面查看具体的问题详情。
· 漫游类:乒乓漫游。
· 连接类-无线:IP地址获取失败、IP地址获取超时、IP地址获取慢、接入失败、接入慢、802.1X认证失败、802.1X交互失败、MAC认证失败、MAC交互失败、MAC认证慢、802.1X认证慢。
· 连接类-有线:MAC认证慢、MAC认证失败、MAC交互失败、802.1X认证慢、802.1X认证失败、802.1X交互失败、IP获取慢、IP获取失败。
展示系统中无线VIP用户和有线VIP用户的用户名、IP地址、MAC地址、健康度等信息。点击列表中的用户名可跳转至该用户的用户详情页面。如果用户没有用户名,将会展示IP地址。
· 单击列表上方的健康度、参数和健康度TOP排名可对用户进行筛选。
· 单击<过滤>按钮,可通过用户名、IP、MAC地址、AP对用户进行过滤并且支持模糊查询过滤,SSID不支持模糊查询。
· 单击列表右上角的<导出>按钮可以将用户列表导出。
通过统计无线终端健康度数据和详细的网络指标信息,获取一段时间内整体上网体验趋势,通过体验质差、质优的角度来体现不同时间段终端的健康情况,分别从终端角度和AP设备角度统计质差时长,展示网络质量差的TOP50用户(终端)和AP信息。
体验趋势统计一段时间范围内在线终端中空闲终端、质差终端与质优终端数量(查询时间段在2天内按照5分钟间隔统计,超过2天按照1小时间隔统计),支持按照时间范围、区域、频段、AP、SSID进行筛选。
表3-17 参数说明
参数 |
说明 |
质差终端 |
根据健康度得分进行评估,得分在阈值之下(默认< 6分)的视为质差。统计间隔内,终端只要在某一个时间粒度内被认定为质差,即视为质差终端 |
质优终端 |
根据健康度得分进行评估,得分在阈值之下(默认>= 6分)的视为质优 |
空闲终端 |
上下行流量<20KB的终端 |
指标趋势将统计的指标按照区间分为:空闲、好、中、差四类,统计在线终端中空闲、好、中、差各类终端数量(查询时间在2天内按照5分钟间隔统计,超过2天按照1小时间隔统计),支持按照时间范围、区域、频段(2.4G、5G)、AP、SSID进行筛选。同一终端在统计时间间隔内有多条报文时,按照指标的平均值来计算指标分类。可查看的指标:信号强度、上行选速、下行选速、时延、丢包率、重传率。
参数 |
说明 |
信号强度 |
AP接收Client发送的报文,RSSI平均值 |
上行选速 |
AP空口接收Client发送的报文速率平均值,整个采集周期AP空口接收报文速率平均值 |
下行选速 |
AP空口发往Client报文的速率平均值,整个采集周期AP空口发送报文速率平均值 |
时延 |
AP空口发往Client报文时延平均值 |
丢包率 |
AP空口发往Client报文丢包率均值 |
重传率 |
AP空口发往Client报文重传率均值 |
终端健康度的计算流程与终端最近发生的问题(接入类、认证类、IP地址类、漫游类、无线信号类、上网慢)有关联,因此,此处展示每个统计间隔内所有在线终端出现的问题总数量趋势图,(查询时间在2天内按照5分钟间隔统计,超过2天按照1小时间隔统计),支持按照时间范围、区域、频段、AP、SSID进行筛选。
质差用户分布展示筛选时间段内质差时长最长的TOP50终端,通过质差时长反应体验最差的终端信息,以矩形树图的形式展示,质差时长大小表示矩形面积大小。单击矩形框支持下钻到“无线用户详情”页面,即可查看该用户接入的详情信息。
质差用户的AP分布展示所选时间段内终端的质差报文都分布在哪些AP上,通过展示AP上质差时长最长的TOP50的AP,间接反应AP整体健康状态。AP质差时长通过分布在AP上的质差报文数量来计算,以矩形树图的形式展示,质差时长大小表示矩形面积大小,同时展示这段时间AP上终端总数量、质差终端数量。点击矩形框支持下钻到“AP设备详情”页面。
质差用户根因分布展示所选时间段内,所选区域内质差用户健康度扣分项、扣分次数情况,支持按照时间范围、区域、AP、SSID进行筛选。健康度得分是根据空口性能的6个指标(信号强度、上行速率、下行速率、时延、丢包率、重传率)和用户近期出现的6类问题(接入、认证、IP、漫游、无线信号、上网慢类问题)综合扣分计算得到,通过统计质差用户在每个扣分项上的扣分次数,反映导致用户质差的原因分布情况。
事件分析功能展示了无线和有线用户的各类异常事件统计。无线问题页签展示了设备上接入的终端或AP遇到的各类问题的统计数据,包括终端接入、漫游、上网问题以及AP探测到的无线环境问题。管理员通过查看近期各类问题的统计数据,可据此进行深入分析。有线问题页签展示了设备上接入的终端遇到的各类问题的统计数据,包括802.1X、MAC认证和DHCP认证有线环境问题。管理员通过查看近期各类问题的统计数据,可据此进行深入分析。
无线问题的整体统计分析页面。
· 问题分布统计:所选时间范围内各种问题小类占总问题数量的百分比。
· 问题趋势:所选时间范围内筛选出的问题种类的问题次数随时间变化趋势图。
· 受影响AP统计:所选时间范围内AP类问题中受影响AP数量百分比(AP类问题包括无法上网和无线环境大类下的所有问题)。
· 受影响终端统计:所选时间范围内终端类问题中受影响终端数量百分比(终端类问题包括接入、认证、IP地址、漫游、无线信号、上网慢大类下的所有问题)。
· 涉及AP:用折线图展示所选时间范围内,由于AP类问题导致的受影响的AP个数随时间变化趋势图。
· 涉及终端:用折线图展示所选时间范围内,由于终端类问题导致的受影响的终端个数随时间变化趋势图。
按照大类划分不同的无线问题,包括接入、认证、IP地址、漫游、无线信号、上网慢。大类下又细分为不同的问题小类,单击小类可查看具体的终端类问题统计详情。
· 统计
¡ 问题次数:该图显示的数据为所选时间范围内每个统计时刻发现问题的总次数、涉及AP数、涉及终端数与在线终端数。针对无法上网问题与无线环境问题的问题次数统计,系统每隔5分钟进行一次采样,其余问题的次数统计,系统每隔10分钟进行一次采样。管理员可对折线图下的滚动条缩放和拖动,以调整折线图显示范围和显示区域。单击折线图中某时刻的统计点,在页面下方的子页签中可查看该时刻下更多细节的统计数据。
¡ 统计分析:可查看原因统计图和趋势图。统计图显示的数据为:所选时间范围内截止到所选时刻,不同问题或原因出现次数的占比(若选择的细分问题与时间有关,比如接入慢、认证慢等,将根据耗时区间进行占比统计;若选择的细分问题与比例有关,比如信道利用率高等,将根据百分比进行占比统计)。趋势图显示的数据为:所选时间范围内截止到所选时刻,发现问题的次数,根据问题的不同将按照具体问题、耗时区间或百分比进行统计。
¡ 涉及AP:所选时间范围内,发现问题涉及的AP的信息,包括AP的名称、接入的AC、发现问题次数以及问题涉及的终端的数量。点击发现次数可查看有关该AP、该细分问题的所有原始数据信息。
¡ 涉及终端:所选时间范围内,发现问题涉及的终端的信息,包括终端MAC、终端厂商、IP地址、问题发现次数、最近一次发现问题的时间等。点击发现次数可查看有关该终端、该细分问题的所有原始数据信息。
¡ 原始数据:所选时间范围内,发现问题涉及的终端的详细信息,包括问题发现时间、终端信息、AP信息、AC信息、Radio信息等。列表显示内容与选择的细分问题有关。
· 影响分布:分别以AC或AP作为统计维度,统计问题发生次数。
· 趋势分析:统计今天或最近7天问题发生次数的变化趋势,同时可预测未来时间段的问题发生次数的变化趋势。
· 根因分析:分析并列出问题的根因并给出处理建议。
按照大类划分不同的无线问题,包括无法上网、无线环境。大类下又细分为不同的问题小类,单击小类可查看具体的AP类问题统计详情。
· 统计
¡ 问题次数:该图显示的数据为所选时间范围内每个统计时刻发现问题的总次数、涉及AP数、涉及终端数与在线终端数。针对无法上网问题与无线环境问题的问题次数统计,系统每隔5分钟进行一次采样,其余问题的次数统计,系统每隔10分钟进行一次采样。管理员可对折线图下的滚动条缩放和拖动,以调整折线图显示范围和显示区域。单击折线图中某时刻的统计点,在页面下方的子页签中可查看该时刻下更多细节的统计数据。
¡ 统计分析:可查看原因统计图和趋势图。统计图显示的数据为:所选时间范围内截止到所选时刻,不同问题或原因出现次数的占比(若选择的细分问题与时间有关,比如接入慢、认证慢等,将根据耗时区间进行占比统计;若选择的细分问题与比例有关,比如信道利用率高等,将根据百分比进行占比统计)。趋势图显示的数据为:所选时间范围内截止到所选时刻,发现问题的次数,根据问题的不同将按照具体问题、耗时区间或百分比进行统计。
¡ 涉及AP:所选时间范围内,发现问题涉及的AP的信息,包括AP的名称、接入的AC、发现问题次数以及问题涉及的终端的数量。点击发现次数可查看有关该AP、该细分问题的所有原始数据信息。
¡ 原始数据:所选时间范围内,发现问题涉及的终端的详细信息,包括问题发现时间、终端信息、AP信息、AC信息、Radio信息等。列表显示内容与选择的细分问题有关。
· 影响分布:分别以AC、AP、SSID、终端、厂商为统计维度,统计问题发生次数;分别以AC、AP、SSID、终端为统计维度,统计问题终端数。
· 趋势分析:统计今天或最近7天问题发生次数的变化趋势,同时可预测未来时间段的问题发生次数的变化趋势。
· 排查建议:列出问题排查的建议。
按照大类划分不同的有线问题,包括认证类和IP地址类。大类下又细分为不同的问题小类,单击小类可查看具体的终端类问题统计详情。
· 统计
¡ 问题次数:可查看问题次数折线图,该图显示的数据为所选时间范围内每个统计时刻发现问题的总次数涉及终端数。针对有线环境下问题的次数统计,系统每隔10分钟进行一次采样。
¡ 统计分析(IP获取失败问题无此项):可查看原因分析环形图和问题统计面积图。原因分析环形图显示的数据为:所选时间范围内截止到所选时刻,不同问题的占比(若选择的细分问题与时间有关,比如认证慢等,将根据耗时区间进行占比统计)。问题统计面积图显示的数据为:所选时间范围内截止到所选时刻,发现问题的次数,根据问题的不同将按照具体问题、耗时区间或百分比进行统计。
¡ 涉及终端:所选时间范围内,发现问题涉及的终端的信息,包括终端MAC、用户名、问题发现次数、最近一次发现问题的时间等。点击发现次数可查看有关该终端、该细分问题的所有原始数据信息。
¡ 原始数据:所选时间范围内,发现问题涉及的终端的详细信息,包括问题发现时间、终端信息、失败信息、时间信息等。列表显示内容与选择的细分问题有关。
· 排查建议:列出问题排查的建议。
异常分析页面展示在所选时间内,整个组网中发生故障的统计,同时可通过切换页签查看根据设备、网络、协议、Overlay和业务分类后的故障信息。
· 概览页面展示故障统计环形图、故障趋势曲线、当前问题列表和历史问题列表等。
· 故障统计环形图展示问题分布统计汇总。
· 故障趋势曲线展示故障产生的趋势,显示粒度为5分钟一个点。
· 当前问题列表展示用户未手动处理的问题列表,纳入故障统计当中。
· 历史问题列表展示用户已手动处理的问题,不纳入故障统计当中。
· 分类展示设备、网络、协议、Overlay、业务和应用故障。
· 在概览页签中展示故障总数,故障类型页签中可查看具体故障个数。
· 分类故障页签下可通过切换容量类、状态类、策略类、连接类、性能类和漫游类,查看具体故障事件的当前数量。
验证页面分为数据面验证、整网预置验证、概览、验证实例列表、验证记录、网络模型、可达性、一致性、存在性详情等页签,展示最近24小时一致性、存在性、隔离性、可达性、子网互访、用户接入的验证结果,验证的记录,生成的网络模型的完整度,验证的变化趋势等,可以通过页面的左上方的选择器来调整时间范围,最多可查看最近7天的数据。
DPV(Data Plane Verification)是数据面验证技术,主要应对业务变更后验证,通过采集配置变更后的网络数据,建模验证网络实际转发行为是否与用户业务变更一致。用户可以通过验证结果辅助确认变更是否符合预期、是否引入问题等等,并且对于验证失败的验证实例,可以进一步定位回溯失败原因,从而极大提升网络变更场景下的运维保障效率。
使用不同的颜色分别展示验证后不通过的验证实例的数目和总数,预定义验证实例不通过数目和总的预定义验证实例数目,所有验证实例中不通过的数目和所有验证实例的数目,验证记录的整体柱状趋势图
· 增加验证实例
¡ 验证系统预定义了供整网范围内进行验证的规则,也就是预定义验证实例,预定义验证实例包括:
- 整网预置可达性: 整网BGP对等体路由可达, 整网VXLAN隧道VTEP间路由可达。
- 整网预置一致性: 链路两侧接口的MTU是否一致, 链路两侧接口的双工模式是否一致, 链路两侧接口的工作模式是否一致, 链路两侧接口的自协商模式是否一致, 链路两侧接口的速率是否一致, 链路两侧接口的VLAN是否一致, 三层链路两侧接口的IP子网是否一致。
- 整网预置存在性: 整网是否存在路由环路, 整网是否存在路由黑洞。
¡ 除系统预定义验证实例外,用户可根据实际需要,自定义可达性、隔离性、子网互访、用户接入验证实例,添加自定义可达性、隔离性验证实例步骤如下: 选择域名称Fabric,输入节点的源和目的的IP地址和掩码,选择协议类型,有tcp,udp,icmp三种,选择途径节点,想要验证源IP到目的IP是否经过某一个节点,点击<确定>可以在验证实例列表里面找到刚刚添加的验证实例。 添加自定义子网互访验证实例步骤如下: 首先选择VRF,再选择域名称Fabric,最后选择需要验证的子网(子网可以选择一个或多个),点击<确定>可以在验证实例列表里面找到刚刚添加的验证实例。 添加用户接入验证实例步骤如下:首先输入验证实例名称,然后分别在源端和目的端,选择VRF、接入设备、接入端口,并输入终端IP,完成后点击<确定>按钮,即可在验证实例列表里面找到刚刚添加的验证实例。
· 启动验证
¡ 验证之后可以跳转到验证记录页签。
· 全量验证
¡ 勾选<名称>旁边的复选框,可以选择全量验证实例。
¡ 点击<全量验证>,弹出确定验证全部验证实例按钮。
¡ 点击<确定>,跳转到验证记录页签,验证记录页签会记录下本次验证是否成功已经验证所花费的时间。
· 删除验证
¡ 勾选某一个验证实例,然后点击<删除验证>按钮,弹出确定删除选中验证实例按钮。
¡ 点击<确定>之后,可以看到这个验证实例在验证实例列表里面被删除。
· 设置验证任务
¡ 点击<设置验证任务>,弹出验证任务框,先“使能”再设置周期,周期可以自己选择,单位有分钟、小时、天,点击<确定>之后,系统会定时触发验证任务。
· 验证记录
验证记录包括本次验证提交的时间,验证的出发来源是手动触发还是定时任务触发,验证的状态是成功还是失败,开始执行时间是本次验证的时间,总耗时就是本次验证的耗时,网络快照就是本次快照的时间,验证范围指的是本次验证是选中的验证实例还是验证的全部的验证实例。 验证记录下面的数据准备,underlay建模,overlay建模,指的是数据在从采集到生成快照过程中每个步骤的耗时,运算验证指的是本次验证运算的耗时。
· 网络模型
¡ 删除快照:选择表单左侧复选框,点击<删除快照>,点击<确认>可以删除选中的快照。
¡ 设置快照参数:点击<设置快照参数>,设置有效时长,单位可以选择分钟,小时,天,点击确定之后,系统会定时触发网络模型的生成。
· 问题上报设置
a. 单击<问题上报设置>子页签。
b. 根据实际需要,设置是否上报问题、网络模型完整度阈值和可达性验证上报条件。
c. 开启问题上报功能后,可以根据我们的验证情况将问题上报到异常分析。
d. 问题上报设置只针对可达性的验证实例,问题上报设置的部分通过和验证实例的部分通过不是同一个概念。
为方便用户使用,DPV根据组网情况自动预置任务。主要检测Vxlan隧道、BGP对等体、设备间的路由黑洞、设备间的路由环路、设备链路的一致性如MTU、双工模式等。预置任务通过验证实例列表中的来源“预定义”标识;预定义的任务可以启动、停止验证,不能删除和修改。
· 可达性
¡ BGP对等体可达
- 可达状态:使用带有方向的箭头图标来标识验证的方向,绿色代表可达,红色代表不可达。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括AS编号,子网和掩码,设备名称和接口名称。
- 目的:验证的目的端,包括AS编号,子网和掩码,设备名称和接口名称。
¡ VXLAN隧道可达:
- 可达状态:使用带有方向的箭头来标识验证的方向,绿色代表可达,红色代表不可达。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括子网和掩码,设备名称和接口名称。
- 目的:验证的目的端,包括子网和掩码,设备名称和接口名称。
· 一致性
¡ 双工模式
- 一致状态:使用绿色的对勾图标标识源和目的的双工模式是一致的,使用红色的感叹号图标标识源和目的的双工模式是不一致的。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括设备名称,接口名称,双工模式。
- 目的:验证的目的端,包括设备名称,接口名称,双工模式。
¡ 速率
- 一致状态:使用绿色的对勾图标标识源和目的的速率是一致的,使用红色的感叹号图标标识源和目的的速率是不一致的。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括设备名称,接口名称,速率。
- 目的:验证的目的端,包括设备名称,接口名称,速率。
¡ MTU
- 一致状态:使用绿色的对勾图标标识源和目的的MTU是一致的,使用红色的感叹号图标标识源和目的的MTU是不一致的。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括设备名称,接口名称,MTU。
- 目的:验证的目的端,包括设备名称,接口名称,MTU。
¡ VLAN
- 一致状态:使用绿色的对勾图标标识源和目的的VLAN是一致的,使用红色的感叹号图标标识源和目的的VLAN是不一致的。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括设备名称,接口名称,VLAN。
- 目的:验证的目的端,包括设备名称,接口名称,VLAN。
¡ 自协商模式
- 一致状态:使用绿色的对勾图标标识源和目的的自协商模式是一致的,使用红色的感叹号图标标识源和目的的自协商模式是不一致的。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括设备名称,接口名称,自协商模式。
- 目的:验证的目的端,包括设备名称,接口名称,自协商模式。
¡ 工作模式
- 一致状态:使用绿色的对勾图标标识源和目的的工作模式是一致的,使用红色的感叹号图标标识源和目的的工作模式是不一致的。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括设备名称,接口名称,工作模式。
- 目的:验证的目的端,包括设备名称,接口名称,工作模式。
¡ IP子网
- 一致状态:使用绿色的对勾图标标识源和目的的IP子网是一致的,使用红色的感叹号图标标识源和目的的IP子网是不一致的。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 源:验证的源端,包括设备名称,接口名称,IP子网。
- 目的:验证的目的端,包括设备名称,接口名称,IP子网。
· 存在性
¡ 路由黑洞
- 路由前缀:IP地址和掩码。
- Fabric:fabric 标识了验证所属的域,在哪个域下进行的验证,一般public就代表全域下面进行的验证。
- 路由前一跳节点:发生黑洞的前一跳节点信息,包括设备名称、出接口、VRF。
- 路由黑洞节点:发生黑洞的这个节点的信息,包括设备名字、入接口、VRF、下一条出接口。
- 疑似原因:产生黑洞的原因是什么。
¡ 路由环路
- 整网中产生路由环路的路径,如果存在的话,就展示产生环路的设备和受影响的路由前缀。
使用一键诊断功能检查设备存在的问题或隐患,并向管理员提供修复建议。
· 立即诊断
a. 在一键诊断页面,点击“查看检查项”,勾选需要检查的项目(必检项无法取消勾选)。
b. 点击<立即诊断>按钮开始诊断。
· 查看诊断结果
诊断完成后,将显示诊断结果。诊断结果分为五种:通过项、不通过项、可优化项、无法诊断项、未检查项,默认全部显示。
¡ 点击各个诊断结果的统计数量,可筛选查看该结果的全部检查项。点击检查项总数,可恢复显示本次诊断的所有检查结果。
¡ 对于不通过和可优化的检查项,点击<展开修复建议>可以查看详细的修复建议。
诊断结果中有显示诊断失败项,通常为无法正常获取设备数据,请优先检查设备连接问题。若设备上管理多台AP,对于同一检查项,只要有一台AP未通过该项检查,则该检查项将被标记为未通过。
· 查看历史诊断信息
在此页面查看诊断历史记录及数据。历史诊断信息仅保留6天,且最多为16条,超出后最早的诊断记录将被删除。
a. 在一键诊断页面,点击“历史诊断信息”,查看诊断历史记录。
b. 点击诊断结果可查看当次诊断详情。
Doctor AP是AP的一种诊断模式,开启后该AP可以模拟成终端接入到AP,全面体验用户的连网流程,以帮助运维人员远程诊断体验类的网络问题,实现网络的智能检测。
主要针对重点网络(SSID)进行全网巡检。
· 测试结果:包含该时间点测试成功次数、测试失败次数统计。
· 测试统计:该时间段无线接入成功、无线接入失败、网络连接成功、网络连接失败、应用测试成功、应用测试失败项的测试次数。
· 自动检测结果:展示自动检测的检测记录。
¡ 点击测试记录仅显示失败结果按钮,开启或关闭仅显示失败结果。
¡ 检测记录包含检测开始、结束时间、被测AC、被测SSID、检测状态及检测结果,状态为“检测中”的记录无检测结果,检测记录根据检测开始时间排序,可根据检测配置查询相应检测记录。
¡ 点击检测记录 ,查看检测详细信息,包含测试时间、SSID、被测AP、Radio ID、Doctor AP名称、Doctor AP型号、Doctor AP MAC、测试状态、测试详情等。点击“详情”链接,查看检测详情。
¡ 检测记录的有效期为7天,7天后会自动删除。
· 手动检测结果:展示手动检测的检测记录。
¡ 点击测试记录仅显示失败结果按钮,开启或关闭仅显示失败结果。
¡ 检测记录包含检测开始、结束时间、被测AC、Doctor AP、Radio、检测状态及检测结果,状态为“检测中”的记录无检测结果,检测记录根据检测开始时间排序,可根据检测配置查询相应检测记录。
¡ 点击检测记录 ,查看检测详细信息,包含测试时间、SSID、被测AP、Radio ID、Doctor AP名称、Doctor AP型号、Doctor AP MAC、测试状态、测试详情等。点击“详情”链接,查看检测详情。
¡ 检测记录的有效期为7天,7天后会自动删除。
主要针对重点网络(SSID)进行全网巡检。
· 同步数据:先点击<同步>按钮同步数据,再进行自动检测。
· 添加自动检测配置:点击<添加自动检测配置>按钮,配置自动检测。
表3-18 参数说明
字段 |
说明 |
选择AC设备 |
新增时定义的AC名称 |
AP检测范围 |
被测AP范围: · 所有绑定被测信号的AP:自动选取绑定了被测信号的AP,最多自动选取128台在线AP。 · 指定AP:支持指定最多128台AP。 |
被测信号 |
配置被SSID,最多可配置3个SSID。 |
诊断项配置 |
配置检测项目: · 默认配置:系统预定义的诊断项配置。 · 自定义配置:用户自定义的诊断项配置。 |
配置关键AP |
AP被选为Doctor AP后,连接此AP的终端会断开网络连接,巡检过程中会排除被设置为关键AP的AP。点击“查看关键AP”查看或配置关键AP。 |
Doctor AP选择策略 |
巡检过程中会遵循以下策略选择Doctor AP: · 默认策略:自动选择终端连接数为0的AP作为Doctor AP,若无法找到则寻找近一小时上下行总流量不超过10MB的AP,若还是无法找到合适AP,则跳过对该AP的检测。 · 自定义策略:自定义最大终端连接数和近一小时最大上下行总流量,只有当AP上的这两项指标同时低于自定义的阈值时,该AP才可以被选为Doctor AP。 |
时间配置 |
巡检时间配置: · 立即执行:配置完成点击保存即触发Doctor AP的自动巡检。 · 定时执行:通过指定某个时间点,触发doctorAP的自动巡检。 · 周期执行:通过配置周期时间,在指定的周期内循环触发doctorAP的自动巡检。 |
· 详情:点击自动检测操作列详情图标,可查看或修改自动检测任务的详细信息。
· 检测结果:点击自动检测操作列检测结果图标,查看自动检测结果信息。
· 中断检测任务:点击正在进行中的自动检测任务操作列的中断检测图标,可将正在进行中的任务中断检测。
· 删除自动检测任务:点击自动检测操作列删除图标,可删除对应的自动检测任务。
· 批量删除自动检测任务:在自动检测任务列表中,勾选自动检测任务后,点击<批量删除>按钮,可删除对应的自动检测任务。
主要针对单个被测信号进行网络巡检。
· 同步数据:先点击<同步>按钮同步数据,再进行自动检测。
· 添加自动检测配置:点击<添加自动检测配置>按钮,配置手动检测。
表3-19 参数说明
字段 |
说明 |
Doctor AP模式 |
选择Doctor AP模式: · 智能模式:系统自动进行智能选取。 ¡ 配置关键AP:AP被选为Doctor AP后,连接此AP的终端会断开网络连接,巡检过程中会排除被设置为关键AP的AP。点击“查看关键AP”查看或配置关键AP。 ¡ 选择被测AP:选择被测AP的所属AC、AP名称及Radio。 ¡ 被测信号:配置被SSID。 · 手动模式:选择一个在线AP进行绑定。 ¡ 选择Doctor AP:在可选择的在线AP中选择一个AP作为Doctor AP。 ¡ 无线服务:选择SSID、被测AP及Radio。 |
Doctor AP选择策略 |
Doctor AP智能模式配置该项。巡检过程中会遵循以下策略选择Doctor AP: · 默认策略:自动选择终端连接数为0的AP作为Doctor AP,若无法找到则寻找近一小时上下行总流量不超过10MB的AP,若还是无法找到合适AP,则跳过对该AP的检测。 · 自定义策略:自定义最大终端连接数和近一小时最大上下行总流量,只有当AP上的这两项指标同时低于自定义的阈值时,该AP才可以被选为Doctor AP。 |
诊断项配置 |
配置检测项目: · 默认配置:系统预定义的诊断项配置。 · 自定义配置:用户自定义的诊断项配置。 |
· 详情:点击手动检测操作列详情图标,可查看或修改手动检测任务的详细信息。
· 检测结果:点击手动检测操作列检测结果图标,查看手动检测结果信息。
· 中断检测任务:点击正在进行中的手动检测任务操作列的中断检测图标,可将正在进行中的任务中断检测。
· 删除手动检测任务:点击手动检测操作列删除图标,可删除对应的手动检测任务。
· 批量删除手动检测任务:在手动检测任务列表中,勾选手动检测任务后,点击<批量删除>按钮,可删除对应的手动检测任务。
探针设置提供了网络内外边界IP地址的配置功能,通过手动配置边界IP地址,来确定内网和外网的边界,用于判断无线网络故障的范围,该功能将用于“CloudNet”APP的无线网络智能检测功能。同时支持将统一数字底盘的信息注册到云端代理后台,在使用“CloudNet”APP进行无线网络检测时,实现将诊断数据通过云端代理转发至统一数字底盘。
· 添加内/外边界IP信息
¡ 在管理范围内/外边界IP表右上角单击<增加>按钮,填写IP和助记名,助记名不可重复。
· 删除内/外边界IP信息
¡ 在管理范围内/外边界IP表中,单击操作列的<删除>按钮,可以删除配置记录。删除操作及时生效。
注册信息用于分析组件注册到云端代理信息的管理,包括:注册信息、修改信息以及删除注册信息。
统计CloudNet APP检测到的6大类问题的数量。
· 6大类问题分别为:认证类、IP类、无线信号、无法上网、上网慢和正常。
· 对于在一段时间内、某特定的物理区域和逻辑区域或者所有区域APP检测到的问题,将不同问题分类统计以不同颜色显示在饼图中,鼠标指向某类问题时,显示该类别下问题的数量。
· 点击图例可以显示/隐藏饼图中对应分类的图形。
统计CloudNet APP检测到的25种问题原因的数量。
· 对于在一段时间、某特定的物理区域和逻辑区域或者所有区域内APP检测到的问题,将各个问题原因统计以不同颜色显示在饼图中,鼠标指向某种原因时,显示该原因下问题的数量。
· 点击图例可以显示/隐藏饼图中对应问题原因的图形。
以列表的方式显示CloudNet APP上传的数据。
提供多种攻击方式的攻击检测功能,如畸形报文、泛洪攻击、蜜罐AP等,并支持对非法设备进行攻击,使其它设备无法关联到非法设备。
(1) 选择“开启”选项,开启攻击检测功能。
(2) 选择检测级别,确认反制项。
(3) 选择检测AP,即在已选AP设备上进行检测及反制功能。配置AP数不能超过128台。
¡ 选择检测级别“高”、“中”或“低”。“高”、“中”和“低”检测级别已分别预定义了检测项及反制项。
¡ 选择检测级别“自定义”,根据业务需求自定义检测项及反制项。
(4) 点击<拷贝SSID扫描的AP配置>按钮,将拷贝“SSID扫描”页面中的检测AP配置,可减少重复配置操作。
可根据对AP使用无线服务的SSID进行匹配或MAC地址进行匹配自定义扫描规则,定义出非法设备,并对其进行反制。
(1) 选择“开启”选项,开启SSID扫描功能,进行SSID扫描配置。
(2) 点击<增加>按钮,在弹窗中增加规则,可配置SSID规则或MAC规则、配置匹配条件、是否开启反制功能。SSID扫描最多可配置10条规则
(3) 选择检测AP,即在已选AP设备上进行检测及反制功能。配置AP数不能超过128台。
(4) 点击<拷贝SSID扫描的AP配置>按钮,将拷贝“SSID扫描”页面中的检测AP配置,可减少重复配置操作。
提供检测仿冒MAC终端的功能,防止仿冒MAC对网络产生危害。
(1) 点击<读取设备>按钮,可以将AC设备本地创建的无线服务同步到平台。
(2) 勾选待开启仿冒MAC检测的无线服务,点击<全部开启>按钮,将所选无线服务批量开启仿冒MAC检测。
(3) 点击某一无线服务仿冒MAC检测开关开启或关闭仿冒MAC检测。
智能预测使用统计学习和机器学习的方法,对时序数据(KPI)进行规律分析,拟合并预测数据的未来走势,生成基线和预测结果。
· 趋势预测:能够分析时序数据的变化趋势,预测最多未来一天的走势,使用了STL(季节趋向性分解)+ETS(指数平滑)算法。适用通用的、数据量特别大和短期预测的场景。
· 设备列表页:设备列表页展示已接收到时序数据的设备信息。被监测设备类型包括有线设备(路由器、交换机)和无线设备(AP)。
¡ 筛选:单击页面上方的<设备来源>、<设备类型>下拉框和<IP地址>、<设备名称>输入框可筛选设备。
¡ 查看详情:单击[操作]栏的<查看详情>按钮可进入设备详情页面。
· 设备详情页
设备详情页默认每页展示4条KPI折线图表,内容包括KPI的实际值、预测值、上界值、下界值。
¡ 路由器的监测指标主要包括:主板CPU利用率、主板内存占用率、备板CPU利用率、备板内存占用率、接口板CPU利用率、接口板内存占用率等;
¡ 交换机的监测指标主要包括:主板CPU利用率、主板内存占用率、设备丢包率、表项资源(如PBR资源、VLAN接口资源、VPN实例资源、VSI资源等)等;
¡ 无线AP的主要监测指标包括:DHCP会话耗时、关联耗时、漫游次数、认证耗时等。
AI任务管理是系统内置任务的运维界面,用户可对任务进行启动、暂停等操作,还支持根据任务场景、任务状态统计任务数。
· 任务场景分析:根据任务场景,统计任务数,在单击某个任务场景时,会下钻任务列表,筛选显示任务。任务场景包括:异常检测、趋势预测。
¡ 异常检测:根据预测出的未来趋势的上下界,与实际数据进行对比,如果落在上下界范围之外,标记为可能的异常点。
¡ 趋势预测:根据历史数据变化趋势,预测未来数据变化趋势。
· 任务列表:分页显示任务列表,任务列表列包括:任务名称、任务场景、任务状态、最近启动时间、上次定时任务运行时间、上次定时任务是否运行成功、操作栏。单击<启动>或<暂停>按钮,启动或暂停选中任务。
¡ 任务启动后,默认每天凌晨一点或三点运行。
· 任务筛选:根据分组名称、任务状态、任务场景筛选任务。
· 批量启动:批量选中未运行任务,单击<批量启动>按钮,启动选中任务。
· 批量暂停:批量选中运行中任务,单击<批量暂停>按钮,暂停选中任务。
· 启动:单击操作栏中的<启动>按钮,启动该行任务。
· 暂停:单击操作栏中的<暂停>按钮,暂停该行任务。
一键调优功能可自动优化AP常用参数配置,使各个AP在当前无线环境中工作在最佳的状态。
使用一键调优功能,可以对指定的一组或多组AP进行自动调优,同时根据AP实际的部署方式选择最适宜的调整方案。
在此页面查看一键调优的进度。调优过程可以刷新当前页面,但在调优过程中请勿对该空间重复执行一键优化操作。
调优历史列表展示调优空间的空间名称、调整时间以及调整前后的信道利用率、信道负载、干扰、丢包率等信息。默认展示24小时内的调优列表,可以通过页面左上方的时间选择器来调整时间范围,最多可查看最近7天的数据。单击列表上方的空间名称、调整时间可对列表排序。点击列表中的“查看详情”可跳转至对应的调优详情页面。
· 邻居AP信道展示图:展示当前空间2.4GHz或者5GHz下具有邻居关系的AP之间的信道关系。
· AP信道分布统计:以柱状图展示调优前后各信道的AP个数和信道负载。
· 调整功率统计:以柱状图展示调优过程中功率的调整情况。
· 调优AP列表:根据AP名称、AP序列号、Radio ID、频段、接入AC、信道、功率、频宽、调优时间等参数展示调优前后参数对比。
开启渐进优化功能,通过对终端和AP历史数据的分析,自动对射频参数进行调整,无需人工参与,减少维护成本,不断优化网络,网络质量将不断提高。
· 网络运行趋势:显示指定时间段网络的健康度评分趋势。评分根据终端的上下行速率、平均信号强度、丢包率、时延计算得出,网络运行评分越高说明网络环境越好。
· 弱信号终端统计:显示指定时间段全部AC设备上的弱信号终端个数。
· 问题统计:显示指定时间段全部AC设备上的问题个数。
· 终端速率:显示指定时间段全部AC设备上终端速率的统计情况。
· 干扰趋势2.4GHz:显示指定时间段全部AC设备上的AP干扰趋势。严重:干扰值>70%;一般:干扰值>50%且<=70%;较轻:干扰值>30%且<=50%;微弱:干扰值<=30%。
· 干扰趋势5GHz:显示指定时间段全部AC设备上的AP干扰趋势。严重:干扰值>70%;一般:干扰值>50%且<=70%;较轻:干扰值>30%且<=50%;微弱:干扰值<=30%。
· 丢包率2.4GHz:显示指定时间段全部AC设备上的AP丢包率。严重:丢包率>=3%;一般:丢包率>=1%且<3%;较轻:丢包率<1%。
· 丢包率5GHz:显示指定时间段全部AC设备上的AP丢包率。严重:丢包率>=3%;一般:丢包率>=1%且<3%;较轻:丢包率<1%。
· 时延2.4GHz:显示指定时间段全部AC设备上的AP时延。严重:时延>500ms;一般:时延>100ms且<=500ms;较轻:时延<=100ms。
· 时延5GHz:显示指定时间段全部AC设备上的AP时延。严重:时延>500ms;一般:时延>100ms且<=500ms;较轻:时延<=100ms。
渐进优化提供优化历史方便查看调整时间和调整详情,优化历史最多支持查看7天数据。调整详情默认显示指定时间内最近一次的调整结果。
· 调优数据:包含调优前/调优后的信道利用率、信道负载、干扰、丢包率、重传率、上行流量、下行流量、流量数据。点击“查看详情”查看调优详情。
· 调优AP列表:查看调优的AP,以及调优前/调优后的信道、功率、频宽数据。
问题智愈基于系统海量数据、大数据分析以及AI算法,无需依赖人工,可以主动识别问题,制定优化方案,自动解决问题,让运维也可以很省心。
打开开关后会弹出优化项页面,为相应问题开启优化权限开关即可开始自动优化。开启问题智愈开关但未开启自动优化项,系统只分析根因并显示优化策略,不会对设备做配置更改。
自动优化需要向设备下发配置,如调整网络的信道、频宽、功率;对终端进行导航、限速、切换射频等。
问题智愈页面显示详细的优化日志和回退日志,获取指定时间内优化了多少问题、有哪些类型,以及详细的优化列表。
· 优化日志:勾选优化日志,查看优化统计日志。
· 回退日志:勾选回退日志,查看回退统计日志。
开启绿色节能开关后,系统会分析和识别AP的业务,在AP的闲时自动下发节能配置,在保持业务连续的前提下实现智能化的节能效果,并形成功耗分析、功耗对比以及节能详情。
AC + Fit AP的组网方式支持,要求Wi-Fi 6 Fit AP 且AC设备的软件版本在R5456及以上。
· 总功耗:显示当前场所指定日期设备的总功耗。
· 节约功耗:显示当前场所指定日期截止到最后一个采样周期设备节约功耗总和。
· 实际功耗分布:显示指定日期中设备在各个时间段功耗分布。
· 历史功耗:显示指定日期中各个时间段内设备实际总功耗趋势,并对比显示节能关闭时预测功耗趋势,系统每隔5分钟进行一次采样。
· 节约功耗分布:显示指定日期中设备在各个时间段的节约功耗分布。
· 节约功耗:显示指定日期中各个时间段内设备实际节约功耗的趋势,系统每隔5分钟进行一次采样。
选择两个相同时长的时段,点击<确定>按钮,对比两个同时长的日期内的设备实际功耗,系统每隔1小时进行一次采样。
· 绿色节能信息:显示当前绿色节能状态/正常工作状态的AP节能状态比例及AP个数信息。
· 绿色节能状态:选择显示时间段,查看该时间段内各采样点处于绿色节能状态或正常工作状态的AP个数信息。
· AP绿色节能详情:显示当前绿色节能的AP详请,包括AP名称、AP型号、当前节能状态、节能模式等信息。
本章节将对SeerAnalyzer分析组件巡检业务进行介绍。完整的巡检需要检查分析组件前端,分析组件后台,网络设备。
· 检查项描述:
检查用户分析相关页面是否显示正常。
· 检查内容:
点击“分析”查看左侧菜单是否存在“健康分析->健康概览、用户分析、应用分析、网络分析;诊断分析->异常分析、数据面验证、无线诊断;处置保障->问题智愈、无线调优、智能节能”等菜单,且菜单下包含如下子菜单:用户健康度、应用健康度、网络健康度、变更分析等。
· 检查结果通过标准:
存在上述菜单,且菜单下包含用户健康度、应用健康度、网络健康度、变更分析等,页面数据回显正常。
· 检查操作实例:
依次点击“分析”下的子菜单,查看页面回显是否正常,下面介绍下分析菜单下几个重要页面:健康概览、用户健康度、应用健康度、网络健康度、变更分析。
在园区场景下,健康概览界面核心展示园区概览及园区拓扑,从全局角度展示园区整体概况。
其中园区概览TAB页从设备、用户、应用三个维护分别展示整网的网络健康度、用户健康度,以及应用健康度,并对园区网主要问题进行分类展示,方便用户及时了解网络健康状态以及主要问题。
表4-1 健康概览
园区拓扑TAB页则从物理拓扑、地图拓扑、业务拓扑以及区域概览四个维度展示全网设备的拓扑结构,以及区域健康分析。
表4-2 园区拓扑
用户健康度日常巡检主要查看无线健康度是否正常范围、健康度趋势显示是否正常、各特征值分布显示是否正常;针对特定用户,可以查看用户健康度、用户相关问题、事件是否正常状态。
数据产生条件:在“分析选项>任务管理:分析任务”中搜索“用户”相关任务,启动“新无线健康度分析、新有线用户健康度分析、用户定时统计”三个定时任务。
总体用户健康度统计。
图4-1 用户健康度
通过用户列表下钻,可看某个用户的健康度详情。
图4-2 用户健康度详情
如果环境中进行了正确的应用分析配置(如无线DPI应用识别、SIP音视频,以及iNQA质量分析等),并且实际环境中有匹配的应用会话信息,则可以在应用健康度页面看到应用统计分析数据,如应用数、流量、时延、抖动、丢包等。
图4-3 应用健康度
其中“音视频质量分析”专指支持SIP和H323协议的音视频应用,点击可查看针对音视频应用的质量分析数据。
图4-4 音视频质量分析
MOS分布展示所选时间段内产生会话质量指标MOS值分布范围占比。MOS值分布占比共有5种,分别是MOS 0-1、MOS 1-2、MOS 2-3、MOS 3-4和MOS 4-5。MOS范围为(0 < MOS ≤ 5),数值越大质量越好。
会话统计展示所选时间段内产生会话的SIP建链成功数、SIP建链失败数和SIP链接关闭数。
网络健康状态巡检关注网络健康曲线输出是否正常,网络健康度曲线中在线设备数(好、一般、差),离线设备数与网络健康柱状图统计分类统计数量是否一致。
图4-5 网络健康度
关注无线设备AP的相关信息:AP设备的在线离线情况对比及趋势、AP信道利用率使用分布统计及趋势、质量较差AP Top10、AP上下行流速Top10、AP连接终端数Top10、AP用户上线失败Top50。
图4-6 AP
通过单击下图设备列表的设备名称,也可以下钻到设备详情中。
图4-7 设备详情
关注详情页设备健康度趋势图是否正常,悬浮每时刻设备详情信息;是否正常展示设备相关的问题列表;是否正确显示该设备在网络中的拓扑图。
变更分析巡检主要关注变更设备列表在设备配置或表项数据发生变更时是否有数据;设备展开后所展示的维恩图(圆圈叠加图)所展示的数据是否与变更对比详情一致;点击变更历史趋势柱状图变更设备列表展示是否正确;在所选时间范围内变更设备占比、Top10变更设备和Top变更项正确展示。
图4-8 变更分析
展开变更设备列表的某台设备,可以看到该设备各数据对比的维恩图(圆圈叠加图),其中左边的数据表示删除的行数,右边的数字表示增加的行数,中间的数字表示相同的行数,需要特别注意的是,修改操作相当于先删除再增加。
图4-9 维恩图
· 检查项描述:
检查问题中心相关页面是否正常。
· 检查内容:
点击“分析”查看左侧菜单是否存在“诊断分析->异常分析”菜单,且页面下包含如下页签:概览、设备、网络、协议、overlay、业务。
· 检查结果通过标准:
存在“诊断分析->异常分析”菜单,且页面下包含概览、网络、设备、协议、overlay、业务,页面数据回显正常。
· 检查操作实例:
依次点击“诊断分析->异常分析”各页签,查看页面回显是否正常,具体见下方说明。
异常分析页面,从网络、设备、协议、overlay、业务维度对各类故障进行统计。
图4-10 异常分析
在首页可查看故障所属类别的统计和不通严重级别故障发生的趋势。
· 检查项描述:
检查任务管理相关页面是否正常。
· 检查内容:
点击“分析”查看左侧菜单是否存在“分析选项->任务管理”菜单。
· 检查结果通过标准:
存在“分析选项->任务管理”菜单,页面数据回显正常。
· 检查操作实例:
点击“分析选项->任务管理”菜单,查看页面回显是否正常,具体见下方说明。
任务管理页面可查看系统中的所有分析任务和采集任务。
图4-11 任务管理
后台部分关键进程、服务在不同部署方式有不同操作,请注意区分场景。
· 检查项描述:
检查分析组件安装路径存储空间。
· 检查内容:
分析组件安装路径存储空间。
· 检查结果通过标准:
执行“df -h | grep /dev”命令查看,存储空间不会超过80%。
· 检查操作实例:
执行“df -h | grep /dev”命令查看各存储卷目录,并记录检查时的磁盘占用率,确保存储空间不会超过80%,超过需尽快清理。
图4-12 查看各存储卷目录
重点关注分析组件单独挂载的三个磁盘分区:/sa_data/kafka_data,/sa_data,/sa_data/mpp_data
· 检查项描述:
检查分析组件各pod运行情况。
· 检查内容:
分析组件各个pod运行状态。
· 检查结果通过标准:
执行“kubectl get pod -n sa”、“kubectl get pod -n oasis”命令查看,pod状态;
· 检查操作实例:
执行“kubectl get pod -n sa”、“kubectl get pod -n oasis”命令查看分析组件各个pod的状态,查看对应输出第三列是Running或者Completed则表示正常。
图4-13 查看pod运行情况
图4-14 查看pod运行情况
需要重点关注的还有:重启次数(第四列)、运行时长(第五列)等信息。
分析组件后台服务需要重点关注的Pod有kafka、zookeeper、redis、vertica等,查看kafka状态,举例如下图。
图4-15 查看kafka Pod
查看容器化应用平台是否有异常的pod
点击系统->系统维护->容器化平台,跳转matrix页面查看是否有异常pod,出现异常POD多次重启需要关注。
图4-16 容器化平台
· 检查项描述:
检查分析组件纳管的设备配置信息。
· 检查内容:
分析组件纳管的设备配置信息。
· 检查结果通过标准:
采集数据的前置条件配置已下发到设备上(使能GRPC、NETCONF、SNMP)。
· 检查操作实例:
登录采集网络设备,使用display this 命令,查看设备GRPC、NETCONF、SNMP等常用采集是否已开启且配置正确。
图4-17 查看设备配置信息
图4-18 查看设备gRPC、NETCONF、SNMP等常用采集是否已开启且配置正确
· 检查项描述:
检查分析组件纳管的设备的用户连接数。
· 检查内容:
分析组件纳管的设备的用户连接数。
· 检查结果通过标准:
用户连接数正常。
· 检查操作实例:
设备连接数在出厂都有一定的限制,用户登录连接过多,可能造成分析组件登录设备异常,从而影响设备采集。日常巡检中可对必要的网络设备使用命令display users,display tcp检查设备连接是否异常。
图4-19 查看设备用户连接数
图4-20 查设备连接是否异常
对分析组件执行完巡检后,可参考如下表格给出正式的巡检报告。
表4-3 分析组件前端页面巡检报告
检查内容 |
检查方法 |
检查结果 |
说明 |
园区概览查看 |
通过概览功能查看全网概览及拓扑是否正常 |
□正常 □不正常 |
- |
网络分析功能查看 |
通过网络分析功能查看设备状态是否正常 |
□正常 □不正常 |
- |
用户分析功能 |
通过用户分析页面查看用户状态是否正常 |
□正常 □不正常 |
- |
应用分析功能 |
通过应用分析页面查看音视频状态是否正常 |
□正常 □不正常 |
- |
变更分析 |
通过变更页面查看故障发生情况及趋势 |
□正常 □不正常 |
- |
异常分析 |
通过异常分析页面查看问题诊断任务是否存在异常 |
□正常 □不正常 |
- |
任务管理功能 |
通过任务管理功能页面查看任务管理是否存在失败、下发失败状态 |
□正常 □不正常 |
- |
表4-4 分析组件后台巡检报告
检查内容 |
检查方法 |
检查结果 |
说明 |
主机CPU占用率
|
登录分析组件的后台,查看CPU使用情况,正常情况下服务器CPU利用率不得大于80% |
□正常 □不正常 |
- |
主机内存占用率
|
登录分析组件的后台,查看内存使用情况,正常情况下内存利用率不得大于80% |
□正常 □不正常 |
- |
主机硬盘使用率 |
登录分析组件的后台,查看硬盘使用情况,正常情况下硬盘空间利用率不得超过80% |
□正常 □不正常 |
- |
命名空间下服务状态检查 |
登录分析组件的后台,查看各命名空间下Pod状态是否正常 |
□正常 □不正常 |
- |
对网络设备执行完巡检后,可参考如下表格给出正式的巡检报告。
表4-5 网络设备巡检报告
检查内容 |
检查方法 |
检查结果 |
说明 |
查看设备配置信息 |
参照设备命令手册(display this),查看NETCONF、GRPC、SNMP等配置是否正常 |
□正常 □不正常 |
- |
设备用户连接数 |
参照设备命令手册,display users,display tcp,查看设备连接数是否处于正常范围 |
□正常 □不正常 |
- |
可以通过组织机构实现对用户的层级划分。
机构管理页面左侧显示机构树形列表(默认展开第一级),页面右侧显示选中的机构信息以及该机构下的操作员列表,如图5-1所示。
在页面左侧的机构树形列表中,单击想要查看的机构名称,页面右侧会显示对应的机构信息。
(1) 页面左侧的机构树形列表中,单击某机构名称右侧的“增加”图标,页面右侧显示增加机构页面。该机构会作为新增机构的上级机构。
(2) 配置参数。
(3) 单击<确定>按钮,完成增加机构操作。
(1) 单击<导入>按钮,弹出导入机构窗口。
(2) 单击“下载模板”链接,可将机构模板.xls文件保存至本地。根据实际需要以层级架构配置机构信息。
(3) 单击<选择>按钮,选择修改后的机构模板.xls文件。
(4) 单击<确定>按钮,完成导入机构操作。
(1) 页面左侧的机构树形列表中,单击某机构名称右侧的“修改”,页面右侧显示修改机构页面。
(2) 单击<确定>按钮,完成修改机构操作。
(1) 页面左侧的机构树形列表中,单击某机构名称右侧的“排序”,页面右侧显示机构排序页面。
(2) 只能对同一层级的机构进行排序,排序范围仅限同一层级机构内。
(1) 页面左侧的机构树形列表中,单击某机构名称右侧的“移动”,页面右侧显示移动机构页面。
(2) 移动范围仅限于当前登录操作员所属机构的下属机构,若被移动的机构下有子机构,则子机构一起迁移。
(1) 页面左侧的机构树形列表中,单击某机构名称右侧的“增加操作员”,页面中央弹出增加用户页面。
(1) 页面左侧的机构树形列表中,单击某机构名称右侧的“删除”图标,弹出确认对话框。
(2) 单击<确定>按钮,完成删除机构操作。
如下情况的机构无法删除:
· 顶级机构。
· 存在子机构的机构。
· 已经被用户绑定的机构。
表5-1 参数说明
参数 |
说明 |
上级机构名称 |
选中的机构会默认作为新增机构的上级机构,无法修改。 |
机构名称 |
该值不能空格开头或结尾,不能包含特殊字符“<”和“&”,不能超过255位,不同层级的机构名称允许相同,相同层级不允许同名增加。 |
机构编码 |
该值只能包含字母、数字、特殊字符和空格,不能空格开头或结尾,不能超过256位。 |
机构位置 |
不能空格开头或结尾,不能超过256位。 |
机构类型 |
机构类型支持IT部门和其他部门两种选择,只作为机构标示,无特殊含义。 |
描述 |
长度不能超过128位。 |
负责人 |
只能选择当前操作员所属机构以及其子机构下的操作员。 |
邮箱 |
长度不能超过128位。 |
联系方式 |
只能输入11位符合规则的电话号码。 |
日志管理提供了查看、导出、删除日志等功能,并支持对日志存储、日志服务器等进行配置。
(1) 在操作日志页面,可查看所有操作日志,也可使用搜索功能(含高级搜索)对操作日志进行筛选查看。页面最多显示 5 万条日志。
(2) 勾选指定操作日志复选框后单击<导出>按钮,可以导出指定的操作日志;单击<导出>按钮,可导出所有操作日志,也可导出使用搜索功能(含高级搜索)筛选出的操作日志。
(3) 单击<删除>按钮,可以删除所有操作日志,也可以删除使用搜索功能(含高级搜索)筛选出的操作日志。
(1) 在系统日志页面,可查看所有系统日志,也可使用搜索功能(含高级搜索)对系统日志进行筛选查看。页面最多显示5万条日志。
(2) 勾选指定系统日志复选框后单击<导出>按钮,可以导出指定的系统日志;单击<导出>按钮,可导出所有系统日志,也可导出使用搜索功能(含高级搜索)筛选出的系统日志。
(3) 勾选表头第一列的复选框,可选择本页面所有的系统日志并对其进行标记操作。
(4) 单击<删除>按钮,可以删除所有系统日志,也可以删除使用搜索功能(含高级搜索)筛选出的系统日志。
运行日志分为全局日志和节点日志,通过全局日志可实现查看所有节点的指定目录和指定日期区间内的全局日志信息,通过节点日志可查看具体某个指定节点上指定目录和日期区间内的节点日志信息。全局日志中所有日志信息全部存储在共享存储中,节点日志中的日志信息存储在该节点中。
(1) 在运行日志页面,单击[全局日志]页签,在全局日志页面可查看指定目录和日期区间的全局日志文件信息。在搜索栏输入指定的文件或者目录名称,可搜索相应的全局日志。
(2) 勾选“全选”复选框,单击<导出>按钮,可导出指定目录和日期段内符合搜索条件的所有全局日志。
(3) 勾选指定日志,单击<导出>按钮,可导出指定的全局日志。
(1) 在运行日志页面,单击[节点日志]页签,在节点日志页面可查看指定节点上指定目录和日期区间内的节点日志文件信息。在搜索栏输入指定的文件或者目录名称,可搜索相应的节点日志。
(2) 勾选“全选”复选框,单击<导出>按钮,可导出该节点指定目录和日期段内符合搜索条件的所有日志。
(3) 勾选指定日志,单击<导出>按钮,可导出指定的节点日志。
(1) 操作日志页面分为日志存储配置和日志服务器配置两个区域:
¡ 日志存储配置区域可配置日志存储天数和过期日志清理时间。
¡ 日志服务器配置区域可配置发送级别、日志服务器的 IP 地址和端口号。其中,日志发送级别从低到高依次为:调试、提示、关注、警告、错误、严重、告警、致命,设置发送级别后,高于或等于该级别的日志将会发送到日志服务器。
(1) 系统日志页面分为日志存储配置和日志服务器配置两个区域:
¡ 日志存储配置区域可配置日志存储天数和过期日志清理时间。
¡ 日志服务器配置区域可配置日志服务器的 IP 地址和端口号。单击 < 增加日志匹配规则 > 按钮,在弹出的对话框中可以配置节点名称、级别等信息。匹配规则配置完成后,后续产生的日志将按顺序匹配规则,匹配成功的日志将会发送到日志服务器。
满足下列所有匹配条件的日志才会匹配成功:
¡ 除级别、描述信息外的其他信息都为完全匹配,即日志的对应信息和匹配规则完全一致。
¡ 日志的描述信息需包含规则中的描述信息。
¡ 日志级别高于或等于规则中的级别。
(1) 运行日志页面分为全局日志配置和节点日志配置两个区域,这两个区域均需配置下列参数:
¡ 日志存储天数:系统会每天清除超过存储天数的日志。
¡ 占用的最大磁盘空间和自动清除时保留的百分比:系统会每小时检测全局日志 / 节点日志占用的磁盘空间,如果全局日志 / 节点日志占用的磁盘空间超过页面设置的“占用最大磁盘空间”,则会自动清除全局日志 / 节点日志。当配置的最大磁盘空间值超过全局日志 / 节点日志所在磁盘分区大小的 80% 时,则按全局日志 / 节点日志所在磁盘分区大小的 80% 作为占用的最大磁盘空间,进行全局日志 / 节点日志自动清除。
License即授权,指新华三技术有限公司授予用户使用特定软件功能的合法权限。
产品需要通过License授权的软件功能以及License授权的相关属性,请参见产品配套的《H3C AD-NET&U-Center 2.0方案License支持情况说明》。
H3C网站提供License的激活申请、设备授权迁移申请等功能:http://www.h3c.com/cn/License
有关License申请、激活文件安装、License迁移等操作的使用指导及详细信息,请参见《H3C 软件产品远程授权 License使用指南》。
通过远程授权方式安装License时,需要先下载并安装H3C License Server软件:
· 单击如下链接可获取H3C License Server的软件包:
· 单击如下链接可获取H3C License Server的配套资料:
在License Server上安装产品的授权后,只需在产品的License管理页面与License Server建立连接即可获取授权,操作步骤如下:
(1) 登录统一数字底盘,单击[系统>License管理>License信息]菜单项,进入License信息管理页面。
(2) 在页面中配置License Server信息的参数。各参数介绍请参见图5-2。
表5-2 配置参数说明
参数 |
说明 |
IP地址 |
安装License Server的服务器上用于数据中心控制组件集群内各节点之间通信的IP地址 |
端口号 |
此处缺省值为“5555”,与License Server授权服务端口号保持一致 |
客户端名称 |
License Server中设置的客户端名称 |
客户端密码 |
License Server中设置的客户端名称对应的密码 |
(3) 配置完成后,单击<连接>按钮与License Server建立连接,连接成功后数据中心控制组件可自动获取授权信息。