新华三公司新闻

  • 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

新华三携手英特尔推出AI训推一体化方案

【发布时间:2026-05-29】

近日,紫光股份旗下新华三集团联合英特尔正式推出基于英特尔® 至强®6处理器的H3C UniServer R6900 G7 AI训推一体化方案。该方案以纯CPU架构实现大模型微调与推理一站式支撑,破解中小企业AI落地“成本高、部署难、资源利用率低”等痛点,为企业私有化大模型、行业智能体、智能问答与知识库场景提供高性价比、高可靠的算力底座,让大模型应用不再遥不可及。

descript

随着大语言模型与AI智能体深度融入各行各业,企业对私有化、低成本、易维护的AI算力需求持续爆发。但传统GPU方案成本高昂、显存受限、训推分离部署复杂,让大量成长型企业望而却步。针对这一行业挑战,新华三与英特尔深度技术协同,依托四路服务器平台与硬件级AI加速能力,打造开箱即用、一机多用、性价比突出的纯CPU训推一体解决方案,重新定义大模型落地门槛。

随着大语言模型与AI智能体深度融入各行各业,企业对私有化、低成本、易维护的AI算力需求持续爆发。但传统GPU方案成本高昂、显存受限、训推分离部署复杂,让大量成长型企业望而却步。针对这一行业挑战,新华三与英特尔深度技术协同,依托四路服务器平台与硬件级AI加速能力,打造开箱即用、一机多用、性价比突出的纯CPU训推一体解决方案,重新定义大模型落地门槛。

R6900 G7作为新华三最新一代四路服务器,为本方案提供坚实硬件根基。产品搭载英特尔®至强®6处理器,内置英特尔®AMX高级矩阵扩展硬件加速器,可高效执行矩阵运算,无需额外GPU即可支撑深度学习训练与推理。平台最高支持64根 DDR5 6400MT/s超大带宽内存,轻松满足模型微调过程中激活值、梯度与优化器状态的大容量存储需求,彻底打破显存瓶颈。同时,四路CPU通过英特尔®UPI高速互联实现高效协同,配合oneDNN、SGLang等全栈软件优化,算力释放更充分、模型运行更流畅。

在实际性能验证中,方案表现亮眼,可单台支撑大模型全流程作业:推理层面,能稳定支持397B超大模型单机推理,35B模型在标准 SLA约束下实现最高80路并发,吞吐量达766.8 tokens/s,并可流畅处理120k超长上下文,满足长文档解析、知识库检索等复杂场景;微调层面,已验证至32B参数模型的LoRA微调,Qwen-3-32B模型约2.4小时即可完成一轮训练,相比上一代平台微调效率最高提升39%,推理首包延迟降低59%,综合性能实现跨越式升级。

descript

相较于传统方案,新华三AI训推一体方案具备四大核心价值:

1、起建成本大幅降低,纯CPU架构省去昂贵GPU投入,最低1TB内存即可启动8B模型微调与35B模型推理;

2、训推一体高效复用,单台服务器同时承担训练与推理,闲置时可运行通用业务、数据库等负载,资源利用率显著提升;

3、部署极简迁移无忧,主流大模型无需修改代码即可快速迁移,降低运维与适配成本;

4、企业级稳定可靠,完善冗余设计、前维护架构与智能散热,保障7×24小时连续稳定运行。

目前,该方案可广泛落地于企业智能客服、办公助手、私有知识库、金融投研、法律文档分析、制造质检、医疗影像辅助诊断等众多场景,尤其适合追求低成本、易部署、高复用的中小企业与机构快速构建 AI 能力。

从算力产品到方案化交付,从硬件支撑到全栈优化,新华三持续以“AI 普惠化”为方向,与英特尔保持长期深度战略合作。未来,双方将继续在处理器优化、AI软件栈、大模型工程化等领域持续创新,推出更多适配行业需求的算力方案,加速AI技术与实体经济深度融合。

新华三官网
联系我们