ZDC    智洞察
智洞察
AI重塑ICT基础设施的能力边界
文 | 新华三集团高级副总裁、技术委员会副主席 刘新民

过去二十多年,每一轮大的技术变革,最先被重塑的,通常都是底层基础设施。互联网改变了网络架构的组织方式,移动互联网改变了数据中心的扩张逻辑,而AI这一轮的影响更深,也更彻底。它不只是带来了新的应用,更是在从根本上改变基础设施本身的能力要求和角色边界。

新华三集团高级副总裁、技术委员会副主席 刘新民

锚定产业需求,做技术跃迁的“筑基者”

当前,算力供给依然处在紧张的状态。一方面,模型参数规模持续扩张,AI应用加速落地,社会整体接受度不断提升,带动算力需求快速上行;另一方面,核心部件供给仍然偏紧,叠加全球供应链的不确定性,高端算力资源仍处于竞争性分配阶段。整体来看,这种供需错配的状态,在未来两到三年内仍将持续。

与此同时,成本结构的含义也在发生变化。因此,尽管供给能力、应用规模与成本水平都在同步提升,但当前阶段的主要矛盾,仍然是需求快速增长所带来的供给压力。不同类型客户的应对策略也呈现出明显分化。互联网企业由于资源充足,仍在进行大规模模型训练,整体呈现出“军备竞赛”特征;而互联网之外的中高端企业则更为谨慎,通常采取“先租后建”的路径,通过租用算力完成业务验证,在确认可行性之后再进入生产阶段。相比之下,政府类客户更聚焦于民生服务与治理效率提升,围绕具体应用场景进行定向投入。

这一差异之下,也直接反映在新华三产品策略上。新华三围绕不同客户群体进行分层布局。面向高端算力需求,推出超节点产品;针对互联网客户,成立互联网与定制化事业群,加速以创新和定制化AI基础设施解决方案切入市场;而对于企业及行业客户,则提供围绕具体应用场景的解决方案。

在这些表层策略之下,一个更为关键的底层逻辑是:技术壁垒的构建,依赖于长期且稳定的算力需求。

从技术研发到产品落地,本身就是长周期的过程。例如,一代网络芯片或光芯片,从设计、验证到调试,周期往往长达三到四年甚至更久。在这一过程中,必须有持续的市场需求作为支撑,否则即使技术研发成功,也可能面临落地无场景的风险。

因此,新华三将自身定位为“技术跃迁的筑基者”,这背后的逻辑则是基于产业长期需求判断的投入逻辑——在关键技术方向上持续投入、持续积累,换取下一轮产业周期的确定性优势。

深化算网融合,释放高质量、稳定的服务能力

解决了“有没有算力”,下一步则是“算力能否以可预期方式稳定输出有效服务能力”。在这一逻辑之下,算力基础设施的评价标准也相应发生转变,由单一性能指标,转向对系统性能力的综合衡量。

首先体现在网络传输的演进上。传统数据中心时代,网络主要承担数据传输功能,核心任务是保障带宽、时延和链路可靠性,完成“从A到B”的数据搬运即可。到了AI时代,网络已经深度参与计算,成为影响整体效率和服务质量的重要因素。特别是在大模型训练场景中,通信算子的执行效率与网络状态紧密相关,网络的拥塞、抖动和负载分布都会直接影响训练效率与任务表现。

与此同时,CPU、GPU和网络通道之间也进入协同感知阶段,调度系统既要了解算力资源使用情况,也要实时掌握网络均衡状态。更复杂的系统还需要具备毫秒级动态调度能力。可以说,算力与网络正在走向深度联动。

在这一过程中,算力基础设施的竞争重点发生了变化。过去更容易被看见的是单点性能,如今更关键的,是能否把算力、网络和调度组织成一个稳定运转的系统,并持续输出可用的服务能力。

这也意味着,对算力基础设施衡量要看整体系统能否稳定协同运行。因此,衡量算力基础设施价值的维度正在持续扩展。时延、吞吐、利用率、成本、可运维性、安全等指标,最终都汇聚到同一个目标上,即高质量、稳定的服务能力。对于大型算力中心而言,稳定始终是核心诉求。训练和推理过程中,任何一次卡顿、抖动,都可能影响业务连续性。故障率客观存在,容错和备份机制也需要在复杂环境中持续完善。

在这一背景下,超节点正成为承载高质量算力服务能力的重要载体。以新华三H3C UniPoD系列超节点产品为例,作为面向高通信开销AI场景打造的超节点产品,其通过柜内卡间全互联通信,为高密度、高效率算力组织提供了有力支撑。

AI in ALL:

从基础设施能力向体系化能力纵深拓展

“算力×联接”的价值,最终要落到高质量、稳定的服务能力上。对新华三而言,这种能力建设不止于基础设施本身,还在持续向产品、研发、服务和行业应用延伸,沉淀为面向AI时代的体系能力。这也是新华三推进“AI in ALL”的重要方向,即推动产品、解决方案,以及研发过程全面嵌入AI。

这一变化首先体现在内部能力建设上。新华三正推动运维能力进一步贴近真实场景,通过更靠近客户需求和运维实践的方式,增强问题识别、分析研判和闭环优化能力。目前,新华三已围绕智能运维持续布局,在网络运维中强化全景可视、智能分析、风险预测和大模型、AI Agent结合的交互能力。

变化也体现在产品体系中。当前,AI与基础设施的融合,既体现在支撑AI业务发展,也体现在产品智能能力的持续增强。目前,新华三AI防火墙已在策略学习、异常识别、智能检测等方面引入AI能力;CloudOS则持续推进与AI融合,强化异构算力统一纳管与智能调度能力,更好支撑模型开发部署和算力服务供给。

在运维场景中,AI能力的引入同样需要循序渐进,优先聚焦状态感知、问题识别、趋势分析和辅助决策等环节,逐步提升系统智能化水平。随着相关能力不断成熟,AI也将进一步向设备侧延伸,推动基础设施从具备连接和算力能力,走向具备感知、分析与协同能力。

也正是在能力持续向上延伸的过程中,新华三对自身角色的定位更加明确。既要做好“筑基者”,持续夯实底层能力,推动基础设施在性能、服务和持续适配能力上不断提升;也要做好“赋能者”,深入行业场景,联合ISV、应用开发伙伴和模型优化伙伴,加快把技术能力转化为客户可感知的业务价值。

这正是“AI in ALL”走向落地的重要路径,也是新华三面向AI时代持续深耕的重要着力点。

关闭