
摘要
大模型训练与推理需求的增长,推动AI芯片算力与功耗同步大幅攀升,高热流密度带来的散热挑战,已成为桎梏AI基础设施迭代升级的核心瓶颈。传统风冷技术已触及性能天花板,而现有的主流液冷方案亦各有短板 —— 单相冷板式液冷存在散热能力上限,浸没式液冷则面临应用门槛与运维难题,两相冷板技术凭借低沸点工质相变潜热的高效利用实现强效散热,既具备卓越散热效能,又兼顾工程落地性,达成性能、成本与运维便捷性的动态平衡。新华三泵驱两相液冷系统针对性突破密封压力控制、高精度温控及兼容运维等核心技术难题,同时牵头联合产业链伙伴制定发布相关团体标准,为高密度算力场景提供了可靠散热解决方案,助力数据中心向低 PUE、绿色化转型,开辟 AI 算力高效冷却全新赛道。
关键词
两相冷板;AI算力;液冷散热;数据中心;PUE;相变潜热
引言
随着大模型训练与推理需求的指数级增长,AI芯片在算力和功耗两个维度上都实现了大幅提升。以英伟达GB300为例,其单芯片热设计功耗(TDP)已高达1200W;超节点架构的普及,进一步推动了智算中心单个机柜功率突破120kW。然而,极致算力的背后,高热流密度引发的散热挑战已成为制约AI基础设施可持续发展的关键瓶颈。研究表明,芯片温度一旦超过70℃,每升高10℃将导致泄漏电流倍增,进而引发性能衰减与可靠性下降。中国信通院数据显示,37%的数据中心服务器故障与过热直接相关。这种“温度‑性能‑可靠性”之间的负向关联,无疑对散热技术提出了前所未有的高要求。
传统风冷技术主要依赖空气对流换热,当单机柜功率超过20kW时便会出现明显散热瓶颈,芯片降频运行现象频发;而功率一旦突破100kW,风冷技术已不具备实际可行性。2024年国家发改委发布的《数据中心绿色低碳发展专项行动计划》明确要求,新建大型和超大型数据中心PUE需降至1.25以下,国家枢纽节点项目PUE更不得高于1.2,传统风冷方案显然已无法满足政策合规与技术升级的双重诉求。为满足高密度算力部署需求,液冷技术凭借远超风冷的导热效率,正从备选方案逐步走向主流,成为突破“算力-功耗-散热”三角制约的关键路径。
1 液冷技术路径解构:主流方案痛点与下一代技术走向
当前液冷技术已形成冷板与浸没两大主流路径分野,分别对应“局部精准散热”与“全域浸泡散热”两种典型模式。
◆单相冷板式液冷:成熟度较高但存在性能瓶颈
作为当前市场占比超90%的主流液冷方案,单相冷板式液冷通过金属导热板与芯片表面紧密贴合,借助冷却液循环实现散热,在兼容现有服务器架构方面具备显著优势。然而,当芯片功耗突破500W时,单相冷板温控能力显著下降,随着芯片功耗持续增长,单相冷板面临散热能力的天花板,为应对更高功耗芯片的散热,系统PUE值也会迅速上升,难以满足未来高算力场景的散热需求。
◆浸没式液冷:极致散热但应用门槛较高
浸没式液冷通过将服务器整体浸没在冷却介质中,能够将PUE有效控制在1.1以下。然而,该技术在规模化部署中仍面临较高门槛。技术层面,冷却液与ICT设备材料之间存在兼容性风险;运维方面,设备故障时需整机吊装更换,单节点维护时间超过4小时。此外,部分冷却液年损耗率与回收处理成本较高,环保合规压力也进一步限制其大规模推广。
◆下一代技术方向:两相冷板技术——高解热能力与实用性的结合
随着未来芯片功耗的提升,行业迫切需要一种强解热能力、兼顾效率、成本与运维的技术方案,在此背景下,兼具高解热能力与工程可行性的两相冷板技术,正成为应对下一代散热挑战的必然选择。
2 两相冷板技术的原理与价值
两相冷板技术的本质在于对相变过程的精准调控,其核心原理是借助低沸点冷却工质在密闭腔体内实现“液态—气态—液态”的循环相变,从而达到高效散热的目的。与单相液冷主要依赖液体温升吸收显热不同,两相冷板技术充分利用工质在相变过程中吸收和释放的潜热,因而具备更强的热承载能力。以典型低沸点工质R134a为例,1公斤冷却工质完全汽化所吸收的相变潜热,约为其从25℃加热至沸点所吸收显热的8–10倍,显著提升了其热承载能力。
表1 单相冷板与两相冷板对比

在实际运行中,芯片产生的热量传导至冷板壁面,冷板内部的微通道结构将芯片产生的高热流密度热量快速传导至环保低压制冷剂,使工质在冷板内发生相变吸热,从而显著提升换热能力并降低器件结温,如图1所示。

图1 两相冷板芯片级散热原理图
生成的蒸汽在压差驱动下汇集至回液歧管并流向冷板远端的CDU,在板式换热器中与一次侧冷却水进行热交换,凝结为液体。在凝结过程中,工质分子间距减小,释放的潜热被排出系统,温度也随之降低。冷凝液随后借助泵驱作用回流至热源区域,继续参与下一次相变循环,形成一个封闭的自维持散热回路,如图2所示。

图2 两相冷板液冷系统方案架构图
两相冷板技术的核心价值,在于有效解决了当前散热领域两大技术路线的关键痛点。相较于单相液冷仅依赖液体显热吸热,两相冷板利用相变潜热将散热效率提升30%–50%;与此同时,该技术也规避了浸没式液冷需整机浸泡的局限,大幅减少冷却液用量的同时使得运维更为便捷。
尽管优势显著,两相冷板技术在推广中仍面临若干关键技术挑战,尤其在密封与控制方面。相变过程中液体汽化引发体积膨胀,系统需实现极高的密封性与压力控制精度,否则易导致漏液或气阻,不仅影响散热性能,还可能损坏电子元件。此外,相变过程动态变化迅速,要求温控系统具备亚毫秒级响应能力,以实时调节冷却状态,避免芯片温度波动,确保运行稳定与寿命。这些挑战也正是当前行业研发与突破的重点方向。
3 新华三泵驱两相芯片级液冷散热系统
针对两相冷板技术面临的密封工艺要求高、温控响应需毫秒级精度的核心痛点,新华三以 “精准控温、可靠密封、智能运维” 为核心,将两相冷板技术转化为可规模化落地的行业解决方案。
图3展示了泵驱两相冷板液冷系统的整体布局。机柜采用模块化分区设计,CPU、GPU及TTV假热源冷板通过Manifold汇流排实现统一分配与回流,确保各支路流量均衡。CDU集成双泵冗余设计及液液换热器,换热能力达60kW,内置PLC与HMI实现实时监控。系统选用环保制冷剂R1233zd,整体兼顾散热性能与可靠性。
1)精密密封与压力控制:根治漏液和气阻难题
系统从结构设计、材质选型到压力控制多环节保障密封性。采用UQD快接件、G螺纹密封接口及卫生级法兰连接,关键密封面覆耐氟EPDM涂层;管路选用304不锈钢与紫铜,避免工质腐蚀。依托氟泵双泵冗余及PID闭环压差控制,供回液压差波动≤设定值的5%,配合泄压保护与液位监测抑制气阻。漏液传感器覆盖关键区域,检测范围10-1000ppm,响应时间≤15秒,可实现早期预警。

图3 新华三泵驱两相芯片级液冷散热系统总装爆炸图
2)高动态响应的温控体系:保障芯片温度稳定
系统冷板流道结构通过微通道优化设计,使流体在有限空间内实现高效换热与稳定流动。针对相变过程的动态特性,系统构建了高精度的温控体系:搭载±0.2℃精度PT100传感器,结合流量、压力传感器实时采集数据。以40℃饱和供液为基准,通过PID闭环调节一次侧冷却水流量与二次侧氟泵转速,控温精度达±1℃,满足CPU壳温≤54℃、GPU结温≤75℃的要求。同时,系统具备露点监测防结露功能,负载动态变化时通过流量-温度-压差联动调节,确保冷板局部温差≤2℃。
3)兼容与运维优化:平衡适配性与便捷性
相较于两相浸没液冷散热方式,泵驱两相冷板技术避免了液冷整机浸泡、运维复杂的弊端,冷却液用量更少。系统采用绝缘工质R1233zd低沸点冷却液,确保泄漏无短路风险且易蒸发无残留,对IT设备100%安全。CPU冷板采用72mm×50mm贴合流道设计,GPU冷板通过串并联回路实现8卡均匀供液。Manifold汇流系统为16支路/9U紧凑设计,各支路流量偏差<10%,配合CDU补排液接口可快速完成工质补充。系统支持RS-485 Modbus RTU协议,可与机房监控系统对接,通过触摸屏实现参数设定、告警查看及远程控制,降低运维成本。
新华三泵驱两相液冷芯片级散热系统通过核心技术的集成创新,不仅破解了两相冷板的固有技术瓶颈,更实现了散热效率、成本控制与运维便捷性的平衡,成为中高密度 AI 数据中心的优选散热方案。
4 以开放共赢的姿态推进两相液冷技术的标准化与产业化进程
新华三集团依托自身在数据中心领域深厚的技术积淀与前瞻洞察,积极牵头并联合产业链伙伴,共同完成了团体标准 T/CAR 24-2025《数据中心泵驱两相冷板式液冷系统技术规范》的制定和发布,有效引导产业链上下游协同创新,降低数据中心部署与运维复杂度,加速两相冷板液冷技术的普及应用,为我国“双碳”目标下的数字经济高质量发展注入强劲动能。

图4 《数据中心泵驱两相冷板式液冷系统技术规范》
5 结束语:从散热革命到绿色基础设施
在AI算力进入“每瓦必争”的时代背景下,散热技术已不再是辅助配置,而是升级为核心基础设施,直接决定着算力部署的密度、效率与可持续发展能力。两相冷板技术凭借对相变潜热的深度利用,在效率、成本与适配性之间找到了黄金平衡点 —— 既破解了单相冷板的性能瓶颈,又规避了浸没式液冷的高门槛,成为未来中高密度数据中心的最优解。
展望未来,随着密封工艺、温控算法与环保工质的持续迭代和优化,两相冷板将进一步拓展其应用场景,为AI时代的无限可能扫清热量障碍。当散热不再是算力的枷锁,数据中心将真正成为 “绿色算力引擎”,为数字经济高质量发展提供坚实支撑。



浙公网安备 33010802004375号