新华三携手英特尔推出AI训推一体化方案

【发布时间：2026-05-29】

近日，紫光股份旗下新华三集团联合英特尔正式推出基于英特尔® 至强®6处理器的H3C UniServer R6900 G7 AI训推一体化方案。该方案以纯CPU架构实现大模型微调与推理一站式支撑，破解中小企业AI落地“成本高、部署难、资源利用率低”等痛点，为企业私有化大模型、行业智能体、智能问答与知识库场景提供高性价比、高可靠的算力底座，让大模型应用不再遥不可及。

descript

随着大语言模型与AI智能体深度融入各行各业，企业对私有化、低成本、易维护的AI算力需求持续爆发。但传统GPU方案成本高昂、显存受限、训推分离部署复杂，让大量成长型企业望而却步。针对这一行业挑战，新华三与英特尔深度技术协同，依托四路服务器平台与硬件级AI加速能力，打造开箱即用、一机多用、性价比突出的纯CPU训推一体解决方案，重新定义大模型落地门槛。

R6900 G7作为新华三最新一代四路服务器，为本方案提供坚实硬件根基。产品搭载英特尔®至强®6处理器，内置英特尔®AMX高级矩阵扩展硬件加速器，可高效执行矩阵运算，无需额外GPU即可支撑深度学习训练与推理。平台最高支持64根 DDR5 6400MT/s超大带宽内存，轻松满足模型微调过程中激活值、梯度与优化器状态的大容量存储需求，彻底打破显存瓶颈。同时，四路CPU通过英特尔®UPI高速互联实现高效协同，配合oneDNN、SGLang等全栈软件优化，算力释放更充分、模型运行更流畅。

在实际性能验证中，方案表现亮眼，可单台支撑大模型全流程作业：推理层面，能稳定支持397B超大模型单机推理，35B模型在标准 SLA约束下实现最高80路并发，吞吐量达766.8 tokens/s，并可流畅处理120k超长上下文，满足长文档解析、知识库检索等复杂场景；微调层面，已验证至32B参数模型的LoRA微调，Qwen-3-32B模型约2.4小时即可完成一轮训练，相比上一代平台微调效率最高提升39%，推理首包延迟降低59%，综合性能实现跨越式升级。

descript

相较于传统方案，新华三AI训推一体方案具备四大核心价值：

1、起建成本大幅降低，纯CPU架构省去昂贵GPU投入，最低1TB内存即可启动8B模型微调与35B模型推理；

2、训推一体高效复用，单台服务器同时承担训练与推理，闲置时可运行通用业务、数据库等负载，资源利用率显著提升；

3、部署极简迁移无忧，主流大模型无需修改代码即可快速迁移，降低运维与适配成本；

4、企业级稳定可靠，完善冗余设计、前维护架构与智能散热，保障7×24小时连续稳定运行。

目前，该方案可广泛落地于企业智能客服、办公助手、私有知识库、金融投研、法律文档分析、制造质检、医疗影像辅助诊断等众多场景，尤其适合追求低成本、易部署、高复用的中小企业与机构快速构建 AI 能力。

从算力产品到方案化交付，从硬件支撑到全栈优化，新华三持续以“AI 普惠化”为方向，与英特尔保持长期深度战略合作。未来，双方将继续在处理器优化、AI软件栈、大模型工程化等领域持续创新，推出更多适配行业需求的算力方案，加速AI技术与实体经济深度融合。

新华三公司新闻

热门推荐

热门推荐

H3C服务器

HPE服务器

热门推荐

H3C存储

HPE存储

热门推荐

商用台式机

商用笔记本

商用显示器

配件

热门推荐

热门推荐

智能终端

技术解决方案

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

专业安全服务

安全运营服务

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

技术支持

自助服务

热门推荐

热门推荐

热门推荐

热门推荐

合作伙伴培训与认证

热门推荐

热门推荐

公司刊物

加入我们

国家/地区

新华三携手英特尔推出AI训推一体化方案

联系我们