随着数字化转型浪潮的推进,越来越多的业务流程被整合为数字化系统,企业网络已经成为企业生存发展的基石,网络环境的稳定性决定了企业日常业务能否稳定开展。随着企业网络规模的快速扩张,网络运维人员面临着网络复杂度激增与系统稳定性要求提升的双重压力。当今企业的核心网络设备上可能承载了成百上千个应用,传统网络运维手段只能通过分析设备运行指标来监控网络运行状态,无法精准监控到每一个应用的网络运行质量或用户的用网体验。当网络中部分应用或用户出现网络性能出现劣化问题时,传统运维手段很难有效的快速定位问题原因,网络一旦产生故障,需要多部门配合、人工排查,往往处理问题进度慢、界定责任难。业务对网络可靠性及最小化故障恢复时间都提出了更高的要求,传统的运维手段在问题发现、问题定位和问题解决的过程中逐渐变得力不从心。
面对数字化转型进程中网络运维的困难,我司推出园区分析组件(SeerAnalyzer-Campus)这一大数据和AI加持的新一代网络智能分析系统。分析组件采用Telemetry等技术实时全量采集网络运行状态数据,利用大数据技术对这些数据进行高效的预处理和存储,使用高性能计算引擎对海量数据进行实时和离线计算,通过专家知识和场景AI算法对复杂的数据进行智能分析,洞察全网健康状态和问题,结合专家知识和关联算法对问题进行根因定位,并对关键故障进行AI预测。
在追求网络最小化故障恢复时间的同时,为了尽可能减少网络故障对业务的影响,甚至达到业务对网络故障的无感体验,Analyzer利用Telemetry高速的数据采集和准实时故障识别能力,结合近20年的网络运维技术经验积累,实现了故障的快速界定、取证以及和控制器连动的隔离闭环。
分析组件基于我司统一数字底盘,采用微服务技术架构(Kubernetes+Docker),通过Telemetry Stream技术准实时采集设备数据(周期采集、自动上报),并利用大数据技术提供海量数据存储以及实时流处理分析、利用机器学习算法进行趋势预测和异常检测,为客户提供实时的网络、用户、应用健康度计算及展示,自动分析识别园区网络故障,并结合园区控制组件形成故障闭环。
网络分析:基于设备系统平面、数据平面、控制平面,以及空口性能等维度信息,综合评估设备的健康度。同时,支持对网络设备的资源使用情况进行监控,跟踪资源变更记录和波动趋势。
用户分析:基于AC和交换机上报的终端数据,实时评估终端用户的接入健康度,并分析影响健康度的因素。同时,对终端接入相关的指标进行统计和分析。
应用分析:基于DPI检测和iNQA分析,识别网络中的应用,并展示应用的流量、丢包、时延、抖动等信息。
网络维度:展示每个设备的健康度变化趋势、系统状态、表项资源、端口、链路等信息。
用户维度:展示每个用户的终端信息,健康度变化趋势,局部拓扑,接入旅程,协议回放等;对于质差用户给出影响用户质量的关键指标分析以及根因建议。
应用维度:展示每个应用的流量统计以及关联用户变化趋势,针对每个应用会话展示时延、抖动、丢包等质量信息。
基于各项指标数据的静态阈值和动态基线,实时监控设备指标数据是否正常。
可以实时感知设备环境的变化,并在发生异常故障时,及时推送告警。
可以详细展示故障的类型,故障的对象,故障发生的时间,并快速完成故障根因分析。
针对不同类型故障,系统可提供建议方案,恢复方案或隔离方案,确保故障快速恢复。
提供一键诊断能力,快速完成网络体检,快速修复的异常项(或可优化项)。
Doctor AP,一种高效的基于用户体验的问题定位方式,帮助运维人员快速解决体验类网络问题。
提供一键优化能力,一键实现全网智能无线射频调优,自动调优。
渐进优化,持续提升用户体验,使用户在使用网络时始终处于最优状态。
问题智愈,自动识别发现无线网络中的问题,并且在无需人工介入的情况下,及时解决问题,实现网络自优化。
1) 一屏概览全网运行状态:从全局角度,直观展示设备、用户、应用三大维度的健康状态以及实时变化趋势。并将园区问题按问题分类和严重级别进行分类展示,同时给出质差用户、质差设备的根因分析,方便用户快速锁定问题范围。
2) 全网拓扑统一展示。物理拓扑可以图形化实时查看当前园区网络中的设备状态以及链路状态。
区域概览以区域为维度对网络、用户健康进行分类统计。列表中各区域网络健康及用户健康一目了然,方便找出低健康度的区域,并可跳转查看对应的区域网络/用户健康度概览及其详情;
楼层拓扑则可以将关注视角直接锁定到具体的楼层中,直观查看每个楼层的平面图,以及当前AP设备的摆放位置及健康状态;
3) 无线质量分析展示园区无线用户体验质量的整体评估结果。基于上线成功率、上线耗时、覆盖、漫游达标率、容量健康度、吞吐达标率、无线设备在服率建立7大类指标监控体系,呈现用户网络体验质量的整体评估结果,并给出了各类子指标趋势和分析。
f
1) 网络健康度
从网络(设备)的维度实时展示园区设备健康状态以及变化趋势图,并对设备分角色进行健康统计,方便用户快速定位问题设备。
网络健康度展示园区所有纳管设备,支持用户查看设备详情,平台通过SNMP/Netconf/Telemetry等多种采集方式收集设备信息,在设备详情中进行全方位展示。支持园区交换机、BRAS、AC、AP,以及EPON设备的健康度分析。
设备详情展示设备的健康度趋势,20+KPI指标得分,得分最低指标,设备问题列表,连接拓扑、表项资源、运行状态等信息,协助用户快速解决问题。其中表项资源中,对设备40+表项资源进行监控,基于AI识别异常变化,并对未来趋势进行预测,超过阈值或上下界波动范围自动产生告警,方便用户及时调整和规划网络。
2) 网络变更分析
通过Netconf,gRPC实时采集全网设备的运行配置,ARP,MAC,路由表等转发表项信息,支持全量采集和增量上报。通过大数据分析,自动生成全网设备的配置变更和表项变更的详细信息,提供变更趋势,变更详情,变更对比,和历史回溯等功能,辅助快速定位网络故障。
从终端用户维度,根据用户的接入指标、接入问题评估用户接入的健康度,同时基于接入耗时、上线/认证/DHCP失败统计、RSSI、SSID、频段等对终端进行统计分析、上线分析等,使终端整体运行状态更直观可视。
用户详情全方位展示用户健康度趋势,AP迁移信息、连接拓扑、问题分析,用户旅程等信息。其中健康度趋势图完整展示一段时间内用户的健康度变化情况,系统支持查看每个时间点的用户指标信息,以及关联AP的健康详情。AP迁移信息可直观展示出用户连接AP的历史轨迹。问题分析给出一段时间内用户的关键异常问题,如认证失败、认证慢、IP获取失败等。
用户旅程完整展示所选时间段内终端用户发生的事件,如漫游、上下线、DHCP等 ,关键事件可以展开查看详细的协议回放。协议回放展示用户接入网络的过程回放,接入过程通常包含关联、认证、DHCP、ARP、DNS等;对于异常事件,协议回放可直观呈现上线过程中每个协议的请求响应情况以及耗时信息,便于快速锁定问题。协议回放主要支持802.1x认证、Portal认证、BRAS认证以及DHCP交互过程。
支持接收无线控制器上报的用户下线细化原因代码,并进行用户下线细化原因的呈现,包括但不限于终端漫游、用户主动下线、终端主动下线、网络侧发起下线等。
分析组件目前支持3种数据源:DPI(无线应用)数据,iNQA(有线应用)数据及eMDI+SQA(音视频)数据。可分别对无线应用 、有线应用,以及音视频应用进行识别、流量分析,以及质量分析。
系统支持SIP、H323协议音视频会议终端质量分析,支持查看会议参与者音视频流质量,包括MOS、丢包率、时延、抖动等,并根据音视频流路径上设备监测音视频质量快速确定故障点。支持质差分析及异常掉线分析,并给出大概率根因及建议。
定时或定期生成健康评估报告,多角度呈现全网区域健康状态及关键指标,并给出网络优化整改建议。
1) 网络/设备/协议/Overlay/业务等常见故障,分钟级故障发现,定位根因并给出处理建议。
2) 问题详情中,可查看故障对象,事件状态,开始时间,持续时间,根因分析,详细过程,处理建议等信息,部分故障支持下发闭环预案。
光模块在长时间使用过程中性能会逐渐下降,当性能下降到一定程度后,可能产生大量CRC错包,影响业务的正常运行。分析组件采集全网光模块KPI指标以及CRC错包信息,借助大数据分析和AI算法,主动监控光模块健康状态,并对未来趋势进行预测。
1) 一键诊断:覆盖设备配置、网络状态、设备运行情况等项目;可灵活设置检查项,满足个性需求。
2) Doctor AP:支持从客户端的角度来诊断WLAN网络的健康程度,使用在线AP来模拟客户端的真实业务流程,并记录及分析探测结果,用户可以根据探测结果排查网络故障。
3) 无线安全检测:通过对信道进行监听及分析处理,从中检测出威胁网络安全、干扰网络服务、影响网络性能的无线行为或设备,并提供对入侵的无线设备的反制,为无线网络提供一套完整的安全解决方案。
一款移动端APP诊断工具,针对园区用户的网络体验问题,实现客户端和后端分析组件的交互,利用分析组件的网络可用性评估和故障根因分析,使客户端实现一键问题诊断和故障上报,运维人员及时发现和响应用户问题。
系统支持将用户设置成VIP用户,重点保障VIP用户的接入体验,可设置非VIP用户限速。
1) 一键调优:根据采集到的用户健康度信息以及连接或空口性能类故障,自动对无线体验不佳的AP的信道、功率、带宽进行一次优化调整,直观体现调整前后的对比,达到提升用户体验,简化维护的目的。
2) 渐进优化:基于终端、AP等历史数据,应用大数据分析和AI算法,预判网络环境运行趋势(如终端潮汐轨迹、AP规律性高负载等),提前规划和调整射频参数,让网络来适配业务,以使用户在使用网络时始终处于最优,提升用户体验。
3) 问题智愈:自动识别发现无线网络中的问题,并且在无需人工介入的情况下,及时解决问题,实现无线网络的自动驾驶。
一级规格 | 二级规格 | 功能描述 |
健康分析 | 健康概览 | ● 支持全网物理拓扑图形化展示,实时查看设备、链路的健康状态及基本信息 ● 支持园区健康评估报告导出 |
网络分析 | ● 支持设备健康度的量化计算,综合设备系统平面、数据平面、控制平面,以及空口性能等维度信息,计算设备整体健康度 | |
用户分析 | ● 支持有线用户健康度的量化计算,综合认证成功率、丢包率、错包率等信息,计算有线用户健康度 ● 支持无线用户事件8大类20+小类,如乒乓漫游、弱信号、射频资源不足、选速低、干扰严重、信道利用率高、重传率高、接入失败、接入慢、802.1X认证慢、MAC认证慢、IP获取失败等 ● 支持有线用户事件2大类8小类,如802.1x认证失败、802.1x认证交互失败、802.1x认证慢、MAC认证失败、MAC认证交互失败、MAC认证慢、IP获取失败、IP获取慢 | |
应用分析 | ● 支持基于SIP、H323协议的音视频应用分析,展示MOS质量分布、会话信息、流量信息,以及应用质差分析 ● 支持基于DPI的无线应用分析,展示会话信息、流量信息,以及应用质差分析 ●支持基于iNQA的有线应用分析,展示会话信息、流量信息,以及应用质差分析 | |
诊断分析 | 问题中心 | ● 支持问题分类统计展示,实时展示全网故障趋势 |
意图验证 | ● 支持基于DPV数据平面验证技术,全面验证园区网络。提供对网络可达、路由环路、链路接口一致性等维度进行验证和诊断 | |
无线诊断 | ● 支持一键诊断,对AC设备进行全面体检,覆盖设备配置、网络状态、设备运行情况等19项 ● 支持Doctor AP检测,使用在线AP来模拟客户端的真实业务流程,从客户端的角度来诊断WLAN网络的健康程度 ● 支持移动APP检测,针对园区用户的网络体验问题,通过客户端与分析组件后台交互,实现用户一键完成在线诊断的功能 ● 支持无线安全检测,通过对信道进行监听及分析处理,从中检测出威胁网络安全、干扰网络服务、影响网络性能的无线行为或设备 | |
预测分析 | 智能预测 | ● 使用统计学习和机器学习算法,对网络、用户、应用模块的时序数据进行规律分析,实现对交换机、路由器和AP设备各项KPI指标的趋势预测和异常检测 |
处置保障 | 问题智愈 | ● 支持自动识别无线网络中的问题,并且在无需人工介入的情况下,及时解决问题,实现无线网络的自动驾驶 |
无线调优 | ● 支持一键调优,自动对无线体验不佳的AP的信道、功率、带宽进行一次优化调整,以达到提升用户体验,简化维护的目的 ● 支持渐进优化,基于应用大数据分析和AI算法,提前规划和调整射频参数,以使用户在使用网络时始终处于最优,提升用户体验 |
标准组网主要有三层架构和二层架构两种模型,其中三层架构主要用户大型园区,二层架构模型主要适用于中小园区,具体组网模型参见如下组网图。
三层架构模型
二层架构模型
在标准组网模型上支持BRAS设备作为园区网的出口网关,实现准出认证和计费或作为准入准出一体化的方案。
融合BRAS组网模型
在标准组网的基础上支持PON能力,支持光电混合和纯光网络。
融合PON组网模型
软件可以免费下载进行安装,需要购买License进行使用。
产品代码 | 描述 |
LIS-SeerAnalyzer-Campus | H3C AD-Campus 智能分析组件授权函 |
LIS-SeerAnalyzer-Campus-Analyzer | H3C AD-Campus 智能分析组件授权函-每服务器 |
LIS-SeerAnalyzer-Campus-AP-VAR | H3C AD-Campus 智能分析授权函-AP-每设备 |
LIS-SeerAnalyzer-Campus-F-VAR | H3C AD-Campus 智能分析授权函-每盒式设备 |
LIS-SeerAnalyzer-Campus-M-VAR | H3C AD-Campus 智能分析授权函-每框式设备 |
LIS-AD-Campus-AP-OPT-1 | H3C AD-Campus 智能分析授权函-调优智愈-每AP |
LIS-AD-Campus-AP-A-1 | H3C AD-Campus智能分析授权函-ONU-每设备 |
LIS-AD-Campus-IA-APP-AP-1 | H3C AD-Campus 智能分析授权函-应用分析-AP-每设备 |
LIS-AD-Campus-IA-APP-F-1 | H3C AD-Campus 智能分析授权函-应用分析-每盒式设备 |
LIS-AD-Campus-IA-APP-M-1 | H3C AD-Campus 智能分析授权函-应用分析-每框式设备 |