手册下载
智能运维Doctor AP技术白皮书-6W101-整本手册.pdf (1.04 MB)
智能运维Doctor AP技术白皮书
Copyright © 2025 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其他公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
随着信息技术的不断发展,各行各业对无线网络的需求持续增长,无线网络已成为支撑业务运营不可或缺的基础。然而,传统网络运维方式存在以下问题:
· 故障定位效率低
当无线网络发生故障时,现场人员往往难以快速定位问题,通常需要依赖网络工程师到现场进行排查,导致解决成本高、周期长。传统故障定位仅从接入点(AP)侧分析,无法还原客户端的真实上网行为,使得诊断结果与实际体验脱节。
· VIP用户保障不足
运维人员需要确保VIP用户享有稳定的无线网络体验,但传统运维方式缺乏主动预警机制,导致在故障发生时往往只能被动响应,无法快速且精准地定位问题根源。
· 全网巡检效率低下
在版本升级后,运维人员需要进行人工抽检以评估无线服务状态。这不仅工作量大、覆盖范围有限,还难以全面掌握全网的运行情况,从而导致运维效率低下,潜在隐患无法及时发现。
因此,无线网络的智能运维已成为迫切需求。H3C智能运维Doctor AP通过“远程终端+提前预警+全网巡检”的智能检测体系,实现云端协同的远程触发机制,帮助客户构建可预测、可诊断的无线网络运维体系,解决传统网络运维中响应滞后、被动处理、效率低下的痛点。
智能运维Doctor AP具有以下优点:
· 零硬件部署
无需额外购置设备,可直接选择在线AP进行网络检测。检测结果自动上报至云简网络平台并支持可视化展示,实现网络故障的快速初步排查,改变传统人工巡检效率低、成本高的痛点。
· 智能选择算法
¡ 灵活选择:系统根据被测AP的位置智能选择合适的Doctor AP进行检测,减少人工干预。同时,用户也可以自定义选择,满足特定网络场景的灵活调整需求。
¡ 关键AP保护:支持关键AP保护机制。已标记为关键AP的设备将自动从Doctor AP候选列表中排除,确保其专注于关键业务,不受检测过程影响,从而保障关键业务的稳定性和连续性。
¡ 精细化管控:支持Doctor AP白名单机制。未配置白名单时,系统默认所有非关键AP均可作为Doctor AP。
· 终端行为模拟
¡ 真实场景模拟:通过远程模式终端从客户端视角模拟真实上网行为,检测并上报报文交互延迟、丢包率及业务访问情况,精准反映用户体验。这一机制有效解决了传统网络故障定位中依赖人工现场逐段排查的效率瓶颈,实现问题的快速定位。
¡ 灵活检测模式:支持对WLAN网络健康状态的定时检测、周期性自动检测(如每日/每周巡检)、7*24小时持续检测,主动发现潜在问题并预警,提升网络稳定性。该机制可针对VIP用户进行重点保障,解决传统网络运维的痛点。
¡ 自定义诊断项:提供DNS解析、DHCP服务、网关连通性等核心网络服务的诊断能力,用户可按需灵活配置检测项。
¡ 多认证方式适配:支持PSK(预共享密钥)、802.1X(企业级认证)及Portal(网页认证),兼容不同网络环境。
· 实时告警推送
开启自动告警策略后,检测过程中一旦发现故障信号,系统立即推送告警,助力运维团队快速响应。
Doctor AP技术通过在线AP模拟客户端的真实业务流程,从终端视角对WLAN网络进行全方位健康诊断,覆盖网络接入、用户认证、网络连通、业务可达等核心环节,实现问题快速发现、故障精准定位、并提出排查建议,为网络健康提供“体检式”服务。
· 网络接入:记录连接过程中的报文交互过程与通信时延,分析AP接入性能。
· 用户认证:检测802.1X/RADIUS等认证协议的可用性及认证服务器的响应时延。
· 网络连通:自动执行DNS解析、DHCP服务、网关连通性等核心网络服务的可用性测试。
· 业务可达:对关键业务服务器进行端到端连通检测。
图1 Doctor AP检测过程
Doctor AP检测支持两种方式:自动检测和手动检测。
· 自动检测:云简网络平台智能选取空闲AP作为Doctor AP,定时或者周期性地对指定检测范围内的AP执行自动检测。此模式支持告警推送、关键AP配置以及Doctor AP白名单配置。
· 手动检测:包括智能模式和手动模式。
¡ 智能模式:云简网络平台会智能选取空闲AP作为Doctor AP,对指定AP立即进行网络检测,并且支持关键AP配置和Doctor AP白名单配置。
¡ 手动模式:需手动选择Doctor AP,对指定AP或者自定义SSID立即进行网络检测。
¡ 持续模式:需手动选择Doctor AP,对指定AP或者自定义SSID进行7*24小时持续网络检测,此功能只对云AP模式的Doctor AP生效。
Doctor AP使用场景分为重点区域诊断、VIP用户保障、全网巡检。
· 重点区域诊断
当无线网络发生故障,运维人员无需到场,通过云简网络平台远程启用Doctor AP检测技术即可自动采集故障数据并进行智能分析,从而快速定位问题。这种方式大幅缩短故障恢复时间,同时降低人力与运维成本。
· VIP用户保障
通过云简网络平台配置Doctor AP周期性检测功能,模拟客户端对VIP用户接入的AP进行持续检测,数据实时上传至云端。异常时立即触发告警,运维人员及时干预,保障VIP用户的高质量网络体验。
· 全网巡检
版本升级后,通过云简网络平台启动Doctor AP全网巡检技术,通过邻居AP互检模式自动筛选AP进行无线信号检测,数据实时上传至云端。运维人员通过可视化界面即可全局掌握AP运行状态,高效验证升级后网络稳定性,确保务平稳运行。
运维人员进入云简网络平台上的智能运维专区,确认待诊断场所中的在线设备数据。
(1) 在智能运维业务专区,左侧导航栏选择“高级 > Doctor AP > Doctor AP检测”,在页面左上方选择指定的分支和场所。
(2) 进入对应分支场所的概览页面,选择“自动检测”或“手动检测”页签,进入对应页面后,单击<同步>按钮,同步场所数据至平台。
运维人员预先配置检测模板,主要包括AC设备、AP检测范围、被测信号相关的SSID、诊断项配置、关键AP、Doctor AP选择策略、时间配置、告警推送策略等参数。
(1) 在智能运维业务专区,左侧导航栏选择“高级 > Doctor AP > Doctor AP检测”,进入Doctor AP检测页面。
(2) 在Doctor AP检测页面选择“自动检测”或“手动检测”页签。
¡ 在自动检测页面,单击<添加自动检测配置>按钮,进入自动检测配置页面进行配置。
¡ 在手动检测页面,单击<添加手动检测配置>按钮,进入手动检测配置页面,选择“智能模式”或“手动模式”的模版进行配置。
在已配置检测模版的Doctor AP 检测页面,开启页面右上方的Doctor AP功能开关。当AC或云AP接收到云简网络平台下发的消息后,会将检测模板内容下发给Doctor AP启动检测。
AP或云AP收到开启Doctor AP功能的消息后,将根据下发的模板执行检测:
(1) 环境扫描:通过空口扫描无线报文,识别当前环境中存在的无线服务。
(2) 服务匹配:从扫描结果中筛选并匹配被测AP提供的无线服务。
(3) 客户端模拟:主动发送802.11协议报文,模拟终端设备接入被测AP的无线网络。
(4) 业务测试:客户端成功上线后,依次执行DHCP地址请求、DNS解析、网关可达性探测、HTTP访问及PING测试等业务验证。
(5) 结果上报:将各环节检测结果通过AC或云AP上传至云简网络平台,供可视化分析。
Doctor AP模式运行期间,AP的射频功能将暂停无线服务,待测试完成后自动恢复。
(6) 结果分析阶段
查看测试结果,用户可以根据测试结果初步进行故障诊断。
用户登录云简网络后,在智能运维业务专区,左侧导航栏选择“高级 > Doctor AP > Doctor AP检测”,进入Doctor AP检测页面。在页面左上角可切换分支和场所,而后单击“概览”页签,可以查看指定分支场所下的AP测试结果。
· 测试总结
¡ 检测记录与成功率:完成4次检测,成功率100%。
¡ 测试类型分布:无线接入测试:4次,网络连接测试:3次,应用功能测试:3次。
前三次测试依次执行了无线接入、网络连接和应用功能测试,而第四次测试仅执行了无线接入测试,目的是快速验证空口接入性能。
图2 查看测试结果
(1) 在Doctor AP检测页面选择“自动检测”或“手动检测”页签。
(2) 进入“自动检测结果”或者“手动检测结果”页面单击“”图标,展开测试列表信息。
(3) 单击测试列表中的“详情”链接,可以查看当前测试的详细诊断信息,包括无线接入、DHCP、DNS、Ping和HTTP。
根据无线接入诊断详情的接入所需时间、测试详情、报文交互,检查客户端所要连接的无线服务是否存在、认证配置是否正确等。
· 测试结果
¡ 测试成功率:100%(4次均成功)。
¡ 历史记录:表明无线服务可用且认证配置正确。
· 详细接入耗时分析(以第一次测试为例)
¡ 总耗时约40秒(统计范围:Probe request → Assoc Response)。
¡ 关键阶段耗时:<100毫秒(Auth Request → Assoc Response),符合标准性能。
¡ 异常原因:总耗时主要受AP的Probe Response报文超时影响。
图3 无线接入诊断详情
根据DHCP诊断详情的申请地址所需时间、测试详情、报文交互,检查网络中DHCP服务器配置是否正确以及响应速度等。
· 测试结果
¡ 测试成功率:100%(4次均成功)。
¡ 历史记录:表明DHCP服务器配置正确,响应速度正常。
· 详细接入耗时分析(以第一次测试为例)
¡ 第一次测试:约500毫秒(主要耗时在DHCP Offer响应阶段)。
¡ 后续三次测试:响应时间均为十几毫秒,符合正常标准。
图4 DHCP诊断详情
根据DNS诊断详情的DNS解析所需时间、测试详情、解析测试结果,检查网络中DNS服务器配置是否正确等。
· 测试结果
¡ 测试成功率:100%(3次均成功)。
¡ 历史记录:表明DNS服务器配置正确,网络连通性正常。
· 详细分析
¡ 响应时间:约30毫秒,符合标准性能。
图5 DNS诊断详情
根据Ping诊断详情的丢包率、测试详情、Ping测试结果,检查诊断模板设置的Ping目的主机是否正确、是否出现大量的广播报文造成网络拥塞、是否服务器禁止Ping操作等。
· 测试结果
¡ 历史记录:进行了4次Ping,统计丢包率25%。
· 详细分析
¡ 对DNS服务器114.114.114.114的测试出现100%丢包,结合对www.baidu.com的0%丢包率,可判定该DNS服务器主动禁用了ICMP响应。
¡ 平均时延:稳定在20~30ms。网络连接质量正常。
图6 Ping诊断详情
根据HTTP诊断详情的往返时延、测试详情、测试结果,检查诊断模板设置的HTTP目的主机是否正确、网址是否被正确解析等。
· 测试结果
¡ 测试成功率:100%(3次均成功)。
¡ 历史记录:表明目标主机配置正确,域名解析无异常。
· 详细分析
¡ 第一次和第三次测试:平均往返时延约30毫秒,网络性能正常。
¡ 第二次测试:测试www.taobao.com时延突增至183毫秒,可能因偶发性网络波动导致。
图7 HTTP诊断详情
Fit AP模式重点区域诊断组网如下图所示。
云简网络平台与AC间建立云管理通道,AC和AP间建立CAPWAP隧道。用户通过Fit AP接入无线网络(AP1,AP3:提供无线服务),发现AP1的Wi-Fi信号出现故障,客户端连接Wi-Fi信号后无法上网。
运维人员通过Doctor AP功能,选择Doctor AP(AP2用于检测,不提供服务,能扫描到AP1和AP3的信号),通过即时定点检测机制,对AP1执行检测。AP2模拟客户端连接流程以检测AP1,检测结果实时上传至云简网络平台。运维人员根据检测报告快速排除故障。
图8 Fit AP模式下重点区域诊断组网图
云AP模式下重点区域诊断组网如下图所示。
云简网络平台分别与AP2、AC间建立云管理通道,且AC需要与AP2处于同一场所内。AC和AP1、AP3间建立CAPWAP隧道。用户通过Fit AP接入无线网络(AP1,AP3:提供无线服务),发现AP1的Wi-Fi信号出现故障,客户端连接Wi-Fi信号后无法上网。
运维人员通过Doctor AP功能,选择Doctor AP(AP2用于检测,不提供服务,能扫描到AP1和AP3的信号),通过即时定点检测机制,对AP1执行检测。AP2模拟客户端连接流程以检测AP1,检测结果实时上传至云简网络平台。运维人员根据检测报告快速排除故障。
图9 云AP模式下重点区域诊断组网图
Fit AP模式下VIP用户保障组网如下图所示。
云简网络平台与AC间建立云管理通道,AC和AP间建立CAPWAP隧道。用户通过Fit AP接入无线网络(AP1提供VIP办公室专用无线服务;AP3,AP4:提供普通办公室无线服务)。
运维人员通过Doctor AP功能,选择Doctor AP(AP2用于检测,不提供服务,部署于VIP办公室邻近区域,能扫描到AP1信号),通过持续定点检测机制,对AP1进行周期性检测,并开启实时告警推送策略。当检测到AP1的无线信号无法连接或连接后无法上网,AP2将及时上报故障信息并触发告警。运维人员可以根据检测报告,及时采取措施排除网络故障。
图10 Fit AP模式下VIP用户保障组网图
云简网络平台分别与AP2、AC间建立云管理通道,且AC需要与AP2处于同一场所内。
AC和AP1、AP3、AP4间建立CAPWAP隧道。用户通过Fit AP接入无线网络(AP1提供VIP办公室专用无线服务;AP3,AP4:提供普通办公室无线服务)。
运维人员通过Doctor AP功能,选择Doctor AP(AP2用于检测,不提供服务,部署于VIP办公室邻近区域,能扫描到AP1信号),通过持续定点检测机制,对AP1进行周期性检测,并开启实时告警推送策略。当检测到AP1的无线信号无法连接或连接后无法上网,AP2将及时上报故障信息并触发告警。运维人员可以根据检测报告,及时采取措施排除网络故障。
图11 云AP模式下VIP用户保障组网图
Fit AP模式下全网巡检组网如下图所示。
云简网络平台与AC间建立云管理通道,AC和AP间建立CAPWAP隧道。用户通过Fit AP接入无线网络(AP1~AP5,提供无线服务)。其中,AP1和AP2可互相检测到无线信号,AP3和AP4可互相检测到无线信号,AP5的无线信号只能被AP4检测到。
运维人员通过Doctor AP功能,启用全网巡检模式,通过全网智能检测机制:邻居AP互检和孤点AP单检,对全网AP进行无线信号覆盖检测。需注意,每个AP在同一时间只能作为被测对象或Doctor AP,不能同时兼任两种角色。具体顺序如下:
(1) AP2检测AP1,AP4检测AP3;
(2) AP1检测AP2,AP3检测AP4;
(3) AP4检测AP5。
在三轮检测结束后,检测数据将统一汇总并上报至云简网络平台。平台自动生成全网AP的可视化检测报告,其中异常数据会被特殊标记,帮助运维人员快速掌握全网AP的运行状态。
图12 全网巡检组网图