欢迎user
日前,以“AI大基建,智芯新世界”为主题的2025全球AI芯片峰会在上海隆重召开。本次大会聚焦AI时代的新基建热潮,众多行业领袖、产业专家与企业代表深度参与,共话技术发展趋势。紫光股份旗下新华三集团受邀出席并发表主题演讲,深度分享新华三基于“算力×联接”理念落地的成功实践——新华三超节点产品,并带来AI基础设施演进的深刻洞察。
新华三集团AI服务器产品研发总监 刘善高
突破技术瓶颈
新华三超节点实现AI基础设施工程落地
新华三集团异构服务器开发部总监刘善高在演讲中指出,当前AI技术发展一日千里,AI应用和大模型百花齐放。然而,以MoE大模型为代表的AI新热潮仍面临诸多瓶颈,这其中尤以资源侧的制约最为突出,与日俱增的大模型参数量、数据量、通信量,让AI基础设施工程落地遇到了不可回避的“算力墙”、“显存墙”和“通信墙”,如何构建高效可靠的多机多卡集群、打造高带宽低时延的通信网络,从而打破单机性能天花板、实现大模型并行技术的高频卡间通信,成为了当下首要解决的问题。
面对百花齐放的多元算力生态,新华三以“算力×联接”理念为指引,基于自身在智慧计算和网络联接领域的深厚积累,通过Scale-up互联技术,开发了基于以太协议和PCIe协议的双技术路线超节点产品,大幅提升单节点计算效能,打造万亿级参数大模型训推的强劲算力引擎。
H3C UniPoD S80000:作为面向万亿级参数模型训推场景的超节点产品,H3C UniPoD S80000实现了更高性能、更高密度、更高效率的三重进化。面对客户追求极致性能的需求,H3C UniPoD S80000以网强算,全面释放算力矩阵动能,柜内卡间全互联通信,互联带宽提升8倍,单卡训练效率较单节点提升25%,单卡推理效率提升62.5%。H3C UniPoD S80000采用液冷高密部署,单柜支持部署64卡,并兼容下一代高性能AI加速卡。此外,三总线全盲插、全面的漏液检测等方面的设计,也极大简化了运维流程、提升能效产出。
H3C UniPoD F80000:依托全国产算力平台,H3C UniPoD F80000采用创新的PCIe光互联技术,突破单机板内走线限制实现了64张AI加速卡的高速互联,将卡间带宽大幅提升至576GB/s,实现模型训练性能提升35%以上。基于灵活开放的产品理念,H3C UniPoD F80000支持基于不同形态的AI服务器及AI加速卡灵活构建超节点产品,支持按需定义产品拓扑16/32/64卡,实现灵活按需交付。
多元开放 以网强算
面向AGI时代的基础设施挑战技术摸高
新华三认为,算力的终极目标是为了获取最佳的AI应用体验,从而推动广泛而深远的行业变革和社会变革,当前的超节点产品不是技术探索的终点,随着AI技术的发展,新华三将不断尝试在算力领域的创新与突破。
在本次大会中,新华三深度分享了关于AI基础设施未来演进方向的洞察:在算力方面,AI加速卡生态将愈发繁荣,计算架构将不断优化,如双Die设计、3DRAM、存算一体等技术将逐渐落地;在联接方面,持续打造高带宽低延迟的卡间高速互联网络将成为必然路径,卡间Scale-up高速互联的技术标准也将逐渐走向统一。当下已经可以看到基于总线的Scale-up网络与基于以太网的Scale-up网络在物理层渐近一致,而未来Scale-up网络需要在物理层、链路层、传输层等各个层级做优化,尤其是支持Load/Store特性以满足AI计算的需求,促进计算与网络融合。基于此,新华三的超节点产品将继续挑战极限,不断尝试AI“技术摸高“。
以超节点产品为全新起点,新华三将更加坚定地深化“算力×联接”能力,加速AI产业生态繁荣,全面构建多元开放、持续进化、AI就绪、强劲稳定的算力基础设施,加速百行百业智慧跃迁。