• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

打造国内首个“算力+服务”一体化AI训练基地

 

极速引擎:部署高性能分布式存储,将大模型训练周期从数月缩短至十几天

全域融合:U-Center一站式智能运维,支撑业务零中断

生态成效:已有200+企业申请使用服务,为50+企业提供API调用服务,成功将亦庄打造为从“千P级”迈向“万P级”的国家级AI创新高地

智算中心作为承载大模型训练、人工智能推理、海量数据处理的重要算力基础设施,正加速融入国家算力体系建设,并成为科技强国战略下新型基础设施的重要组成部分。北京数据基础制度先行区公共智能算力中心在2024年3月正式点亮。该项目具有里程碑式的战略意义。

国内首个“算力资源+运营服务”一体化建设工程正式落地,它打破了传统仅出售硬件算力的模式,致力于提供如同水电一般便捷、可按需配置的算力运营服务。与此同时,国内首个人工智能数据训练基地也同步建成,该基地专为大模型训练打造,旨在解决初创团队长期面临的“算力难寻、环境不稳、数据不安全”等关键痛点。

北京亦庄人工智能公共算力平台作为“新型基础设施标杆工程”,要求能“支撑万亿级参数大模型训练的公共算力平台”。面对这一国家级创新工程的高标准需求,紫光股份旗下新华三集团凭借在数字化基础设施领域的深厚积淀,提供了涵盖安全防护、计算存储、数据中心网络、绿色机房的全栈式解决方案,为这一“首创”模式的落地筑牢了坚实底座。

兼顾一体化算力调度与训练场景落地

要同时实现“运营服务化”和“训练基地化”,项目面临三大严峻挑战:

◆ 服务化门槛高:要让企业像用自来水一样用算力,底层设施必须具备极高的稳定性和自动化运维能力。

◆ 训练场景要求极苛刻:大模型训练需要海量数据的高速吞吐,对存储的IOPS、网络的低时延提出了极致要求。

◆ 安全合规是生命线:作为数据要素先行区,汇聚了政府、医疗、自动驾驶等高敏感数据,必须满足等保2.0三级甚至更高的安全标准。

对此,北京经开区相关负责人在谈及项目规划时曾明确指出:“我们希望通过算力调度平台的建设,让用户在享受算力服务时就像是使用水电一样便捷流畅。紧抓北京数据基础制度先行区建设契机,我们正在构建基础网络、智算中心、调度平台、可信空间、训练基地五位一体的新型数据基础设施。”

全栈融合,定义“算力服务”新标准

针对上述挑战,新华三交付了一套端到端的全栈基础设施体系,完美契合“资源+服务”的一体化定位。

◆ 铺设“高速路网”:高性能网络保障算力自由流动

为了支撑“算力资源”的高效调度与流转,新华三构建了高密度、低时延的数据中心网络,如同为算力中心铺设了一条条“信息高速公路”。

采用数十台数据中心交换机,以S105系列交换机作为核心骨干,提供超大带宽,确保算力集群内部通信无阻塞;S68、S55系列交换机则作为接入层,实现算力节点的高速互联。

这种网络架构不仅保障了管理平台与存储系统、GPU服务器之间的数据极速交互,更支撑了“按需配置”的服务模式。无论是突发的大规模训练任务,还是多租户并发的推理需求,网络都能像水流一样灵活调度,确保算力资源在不同任务间无缝流转,真正实现了“算力即服务”的流畅体验。

在数据中心运维层面,新华三所提供的U-Center统一运维平台,采用微服务集群架构,从客户整体运维的角度出发,以面向业务服务为目标,提供融合“云-网-端”ICT基础架构资源的集中管理。可灵活应对多机构、多张网、大容量、分级分权的复杂应用场景,实现“云、网、端、安”异构全域混合资源“一站式”管理。同时支持对新华三运营管理软件和第三方运维工具进行整合,为运维人员提供统一的运维解决方案。

◆ 打造“训练引擎”:PB级分布式存储释放AI算力潜能

针对“人工智能数据训练基地”的高性能需求,新华三构建了强大的数据存储底座,旨在解决大模型训练中“数据喂不饱、读写太慢”的瓶颈。

项目部署了2套分布式存储系统,总容量达20PB。其中,5PB全闪存CX8000专为高频训练数据设计,提供微秒级低时延,确保GPU集群在读取海量训练样本时“零等待”;而15PB混合闪存CX5000则用于海量历史数据与冷温数据的低成本存储。

这一架构的落地,直接将大模型训练效率提升至新高度。企业无需再为数据读写卡顿而焦虑,原本需要数月才能完成的训练周期被大幅缩短至十几天,完美诠释了“运营服务”带来的效率革命,让算力真正成为推动AI创新的加速器。

◆ 构筑“可信空间”:等保三级安全体系护航数据要素流通

作为“数据训练基地”,数据安全是运营服务的基石。新华三部署了整套等保2.0三级防护安全系统,构建了从边界到终端的纵深防御体系。

通过态势感知与抗D设备实时识别并阻断外部攻击,配合防火墙与负载均衡(LB)保障业务高可用,新华三为算力中心穿上了一层“金钟罩”。更为关键的是,堡垒机、日志审计、数据库审计(数审)以及漏洞扫描系统的全面上线,确保了所有运维操作与数据访问“全程留痕、可追溯”。

这种全方位的防护能力,彻底消除了入驻企业对数据泄露的顾虑,让政府、医疗及自动驾驶等高敏感行业敢于在此进行大模型训练,真正实现了“可信数据空间”的运营承诺,为数据要素的安全流通扫清了障碍。

夯实“绿色底座”:微模块机房确保服务永续

“运营服务”的核心在于SLA(服务等级协议)的达成,基础设施的稳定性直接决定了服务的可靠性。

新华三采用了数组微模块设计,既实现了快速部署,又为未来算力规模向万P级演进预留了充足的弹性空间。通过DCIM动环管理平台,数十台精密空调、智能小母线及一体化电力模组被纳入统一监控,实现了对温湿度、电力的精准调控。

配合蓄电池与配电柜构建的双路供电与UPS系统,即使在极端情况下也能确保业务“零中断”。这一绿色、智能的底座,让企业无需担心硬件故障导致的训练中断,能够心无旁骛地专注于算法创新与模型迭代。

算网安存深度融合多家科技企业入驻算力平台

通过新华三全栈方案的赋能,北京数据基础制度先行区公共智能算力中心成功实现了两大核心定位,成为了行业标杆。

北京国际算力服务有限公司负责人对项目运营模式给予了高度评价:“作为全面支撑北京数据产业发展的重要支撑,京算公司将围绕‘打造北京国际算力调度中心’这一目标,建设‘一张算力供给网络、一个算力调度平台、一套算力服务规则’,保障算力资源自由流通、价格公允、按需配置和安全可信,全面支撑先行区的制度突破创新和要素高效流通。”

依托H3C U-Center平台与安全、网络、存储的深度融合,亦庄成功推出了“算力资源+运营服务”一体化模式。北京亦庄人工智能公共算力平台一经上线就吸引了26家高科技企业入驻,这里已成为大模型迭代升级的首选之地,截至目前有超过200家企业申请使用服务,已为50余家企业提供API调用服务,使企业能够以更低的成本享受到高效、安全的人工智能服务。目前,该项目已点亮5000P算力。根据规划,亦庄未来将打造超10000P的算力规模。

北京经开区相关负责人在展望未来时充满信心:“完成5000P公共智能算力中心建设运营,同步建设算力调度服务平台,未来,亦庄的蓝图正在变成实景图,我们将成为数据要素集聚区、数据产业发展高地。”新华三集团将继续深化与亦庄的合作,基于本次落地的全栈基础设施经验,持续优化安全、存储与网络架构,支撑亦庄从“千P级”向“万P级”迈进,助力北京数据基础制度先行区成为全国乃至全球数据要素流通与人工智能创新的标杆高地。

新华三官网
联系我们