欢迎user
近日,以“拥抱AI变革,点燃算网引擎”为主题的2025开放数据中心大会(ODCC)在北京启幕。紫光股份旗下新华三集团受邀出席网络分论坛,交换机产品管理部总监陈伯超发表《多元智算 端网协同》主题演讲,与业界专家共同探讨AI时代算力与网络深度融合的实现路径,并重点介绍了新华三在智算网络架构创新及端网协同技术方面的实践成果。
AI算力发展对下一代智算网络提出关键挑战
随着AI基础设施日趋成熟,网络投入占比虽有限,但对提升算力效率起着关键作用。优化网络不仅能显著缩短模型训练时间,还可降低因故障带来的高额损失。陈伯超在演讲中表示,当前AI模型参数规模从万亿跃升至数十万亿,网络正面临前所未有的挑战:它需要在端口密度、带宽与收敛时延上同步升级,能够灵活调度复杂多变的流量、实现端网协同,同时支持多品牌、异构算力的平滑接入,从而保障大规模算力集群的高效互联与流量调度。
新华三DDC架构:打造创新零阻塞智算网络
为满足智算中心在异构算力兼容、多品牌协同及敏捷调度方面的新需求,新华三集团推出了创新零阻塞智算网络架构——DDC(Diversified Dynamic-Connectivity,多元动态联接)。该架构基于全新设备与系统设计,依托Comware V9操作系统,整合信元级转发平面与大规模组网能力,通过引入VOQ(Virtual Output Queue)与信元交换机制实现流量100%负载均衡与零拥塞传输,精准解决AI应用中的拥塞与调度难题。大会期间,新华三DDC交换机H3C S12500AI在ODCC展位重磅亮相,成为现场关注的焦点。
新华三DDC交换机H3C S12500AI亮相ODCC展位
信元交换技术实现多元算力免调优接入。基于信元交换,数据报文在NCP内被切分为等长信元并喷洒至多条路径,消除传统哈希极化问题,同时在网络侧完成重组,无需网卡支持乱序重排,对GPU流量模型和特征不敏感。这一机制确保端口高效利用,实现多元异构算力的免调优接入,不同网卡与GPU均能达到最佳均衡效果,显著提升训练效率、降低通信消耗。经Tolly验证,DDC架构在有效带宽方面相比ECMP最高提升107%,在All-to-All流量模式下性能较InfiniBand平均提升2.5%,展现出显著优势。
大规模组网方面,DDC架构展现出高度灵活性。单集群组网可容纳最多40个NCF和256个NCP,实现400G接入规模达9216端口,800G接入规模达4608端口;而通过同编号GPU平面互联及跨轨道NCP Mesh互通,多集群组网可将400G接入规模扩展至73728端口,800G接入规模达36864端口,从而充分满足超大规模智算中心的部署需求。
DDC架构引入硬件级VOQ技术,实现全局流量智能调度。VOQ通过带宽申请与多队列灵活转发,结合拓展BGP的开放调度机制,可支持超60K链路秒级同步,确保数据无阻塞传输。该机制同时支持基于优先级的调度,优化路径分配,提升带宽利用率,从而有效缓解拥塞、提高训练效率,为超大规模智算集群提供稳定高效的网络支撑。
DDC架构自设计之初即遵循生态开放路线。其控制平面采用标准BGP EVPN协议,实现网元自协商、自组网,降低了配置复杂程度。此外,新华三联合生态伙伴针对DDC架构开放和标准化分别在需求场景分析、方案框架定义、技术方案落地等三个方面提交多篇标准议案,致力于推动产业界开放互联。日前,国内领先社区平台小红书与新华三合作完成了国内首个基于DDC架构的智算网络规模化验证。测试结果显示,DDC在带宽、延迟、集合通信及容灾等关键指标上表现优异,有力支撑大模型训练。
端网协同方案 实现多元算力高效融合
为推动多元算力高效融合,新华三推出端网协同方案,通过创新调度算法与开放生态合作,实现端侧与网络的紧密协作与智能优化。一方面,AD-DC智算版可实时监测全网链路状态,计算最优路径熵值并下发至网卡,确保交换机精准HASH至指定路径,显著提升网络利用率;另一方面,增强型CBRC算法在报文中插入ECN、Trim等状态信息,使端侧感知网络拥塞状况,实现Per-port维度的精准拥塞控制,并在端口拥塞时动态调整不同路径的发送速率以减少拥塞的影响。
目前,端网协同方案已在50余款智算交换机产品(涵盖商用与国芯平台)完成验证,并通过与6家GPU厂商及3家主流网卡厂商的互通测试。在Llama3模型实测中,该方案较传统ECMP网络性能平均提升16%。
除了面向智算中心内部的互联技术创新,本届大会上,中国移动联合新华三展示了面向智算协同训练场景的高性能互联设备。该设备支持288×800G彩光接口,可满足高带宽与Burst流量需求;支持硬件快速CNP(10μs级别),避免长距互连导致端侧网卡吞吐降低;此外,设备结合高效前后直通式散热设计,满足高密度、高功耗800G彩光模块的稳定部署需求,为分布式协同训练场景提供可靠支撑。
中国移动联合新华三展示面向智算协同训练场景的高性能互联设备
未来,新华三将持续秉持开放共赢理念,依托领先的工程实践、完善的智算产品、多元芯片战略和开放标准建设,打造高效、稳定的智算网络,为百行百业智能化升级提供可靠支撑,加速迈向智能新时代。