欢迎user
近日,以“拥抱AI变革,点燃算网引擎”为主题的2025开放数据中心大会在北京拉开帷幕。本届大会由开放数据中心委员会(ODCC)主办,作为数据中心领域的行业风向标,吸引了众多行业领袖与企业代表参与。紫光股份旗下新华三集团受邀出席并发表演讲,分享了在AI算力基础设施领域的关键技术实践——基于Scale-up互联技术打造的高性能超节点产品。
新华三集团云与计算存储产品线高级产品经理 程凯
应对规模应用挑战
算力底座需向高效与开放演进
随着大模型持续演进,算力基础设施面临模型参数量激增、“算力墙”、“内存墙”以及单卡单机性能天花板等多重制约。多机多卡、MoE稀疏化、卡间互联限制算力发挥,以及TP/EP等高频通信场景,也对高带宽、低延时网络提出了更高要求。新华三认为持续提升系统性算力性能更依赖于软硬件的协同优化,加强与软件开发及软件工程化的紧密配合,能够充分发挥硬件动能,快速赋能AI应用。
应对AGI时代的算力挑战,技术发展已呈现明确趋势,算力基础设施正朝着多元开放、以网强算的方向快速发展。大规模参数模型训推场景下,通过Scale-up互联将服务器集群升级为一体化超级服务器,从而有效提升单卡训推效率已成为必然趋势。超节点产品从基础设施深度集成与软硬件协同优化等方面充分体现系统工程创新对于算力系统性能提升的重要价值,同时,面对客户的不同使用场景和算力需求,超节点产品在实现高带宽、低时延的基础上,也必须要具备兼容通用的协议、开放成熟的生态链及灵活拓扑等能力。
新华三UniPoD系列超节点
以“算力×联接”驱动AI新基建
为此,新华三集团以“算力×联接”战略为核心,推出了UniPoD系列超节点产品,基于多元算力生态,开放兼容以太和PCIe协议双技术路线实现高性能Scale-up互联,支持整机柜液冷集成交付与节点机柜解耦交付,通过软硬协同优化实现快速业务构建与全栈能力交付。
■面向千亿级参数模型训练,UniPoD F80000依托全国产算力平台,采用创新的PCIe光互联技术,突破单机板内走线限制,实现64张AI加速卡的高速互联,卡间带宽大幅提升至576GB/s,模型训练性能提升35%以上。该产品支持基于不同形态AI服务器及加速卡灵活构建超节点,可按需定义16/32/64卡拓扑,实现灵活交付。
■针对万亿级参数模型训推一体场景,UniPoD S80000实现了性能、密度和效率的全面突破。该产品以网强算,实现柜内卡间全互联通信,互联带宽提升8倍,单卡训练效率较单节点提升25%,单卡推理效率62.5%。其单柜支持部署64卡高密部署,整柜液冷散热功率可达120KW,兼容下一代高性能AI加速卡。三总线全盲插与全面漏液检测等设计,也显著简化运维流程并提升能效产出。
展望未来,新华三集团将持续推动超节点架构向开放、融合、绿色方向演进,打通多元算力规模化应用的关键路径,助力构建面向AGI时代的先进算力基础设施,为百行百业的智能化转型提供坚实底座。以全栈创新支撑数字经济的深化发展。