扫码加入

  • 正文
  • 相关推荐
申请入驻 产业图谱

数据中心冷板液冷系统设计的五大关注要素

2025/07/03
3436
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

冷板液冷系统的分类

根据CDU一次侧散热形式的差异,冷板液冷系统大体上可以分为液液型冷板液冷和风液型冷板液冷。

液液型冷板液冷系统包含一个二次侧闭环回路,可通过间接冷却(如机架安装的后门热交换器)或直接冷却(如芯片级冷板)为IT设备提供冷却流体。二次侧回路是一个低压密封系统,IT设备的高热密度区域的热量通过一个低压降板式热交换器排出到外部冷却水源(一次侧回路)。二次侧回路可确保数据中心环境中的冷却液保持最小容量,对流量、压力和温度进行严密控制(冷凝控制),并准确保持流体质量(过滤和添加)。一次侧冷却源可以是冷冻水系统(专用或来自建筑物系统)、冷却塔或干冷器,具体取决于所需的二级温度和传热规格。

风液型冷板液冷系统包含二次侧回路,为IT 设备提供冷却液供给以进行直接冷却(例如芯片级冷板)。冷却液回路是一个低压密封的系统,低压降制冷盘管换热器将热量从IT设备的高热密度区域排出到环境空气中。一次侧冷源是数据中心的冷空气,通过风液型CDU将服务器热量,传递至机房,最终通过机房空调带走所有热量。热传递将取决于空气温度和流速。

冷板液冷系统设计的五大关注要素

1) 供液温度

冷板液冷系统的供液温度设计需充分考虑不同芯片及服务器制造商的特定要求,如Dell可能接受高达32℃甚至更高的供液温度,而Nvidia则设定在25℃至45℃的较宽范围内。需要注意的是,必须严格避免供液温度过低,以防止水蒸气凝结现象的发生,这可能严重损害IT设备的正常运行。此外,系统还需具备强大的稳定性,确保在一次侧流量出现波动时,二次侧仍能维持稳定的供液温度,以保障整体散热效能与设备安全(如下图)。

2) 供液流量

冷板液冷系统的供液流量设计是确保高效散热与稳定运行的关键环节。CDU(冷量分配单元)在此过程中扮演着核心角色,负责精确调控一次流体与二次流体的流量。具体而言,二次流体需维持稳定的流速进入IT设备,以在设备满载时能够有效从冷板中带走所有热量,保持IT入口温度的恒定。同时,一次流体的流量则根据需散热的热量动态调整,并依据CDU的接近温度(ATD)进行调整。

为了确保流量控制的精准性,系统要采用压差控制并辅以实时监控,以确保系统中的泄漏不会导致压力下降。此外,通过CDU内泵与电源的冗余设计,系统能够在关键业务场景下保障流量的连续供应,进一步提升整体系统的可靠性与稳定性。

3) 过滤要求

冷板液冷系统要求冷却液顺畅通过冷板内极其微小的通道,这些通道的宽度可精细至仅27微米。堵塞不仅会限制流量,甚至可能完全中断IT设备的冷却,导致维护成本急剧上升,因此系统对冷却液的过滤精度提出了严格标准。通常,这一精度需低于冷板通道的最小尺寸,业界经验倾向于采用25微米或更细的过滤级别。此外,为确保系统长期保持清洁状态,CDU(冷量分配单元)需持续进行在线过滤,这是维护系统高效运行与延长使用寿命的关键措施。

4) 流体选择

在设计冷板液冷系统的初期,选择合适的流体化学成分及可靠的供应商非常重要。一旦确定流体策略,后续的任何更改都将涉及繁琐且成本高昂的清洗与净化过程。此外,流体的选择还会在调试阶段带来显著复杂性,包括循环测试、杂质冲洗以及系统气泡的排除,这些工作对于每台服务器及整体解决方案的顺利运行都至关重要。在整个系统使用周期内,对液体的持续关注同样不可或缺,需定期进行pH值、外观、抑制剂浓度及污染物水平的检测,以确保其性能稳定与系统的持续高效运行。同时,所有冷却液均需遵循严格的存储与处理规范,并配备适当的个人防护设备以保障操作安全。

在冷板液冷系统的二次侧流体选择中,存在三种主流方案。首先,去离子水配方液换热效果优越,然而其腐蚀风险不容忽视,需采取额外措施加以防范。其次,乙二醇配方液虽具备一定的防腐能力,但其毒性相对较大,且在环保要求较高的地区,其排放处理成为一大现实问题。最后,丙二醇配方液作为Intel、Nvidia等业界巨头推荐的选择,由于其防腐效果更好,成为众多用户信赖的优选方案。

在选择时,需综合考虑流体性能、成本、环保要求及安全性等多方面因素,以做出最适合自身需求的决策。

5) 故障预防和检测

在冷板液冷系统中,除了二次流体网络内其他传感器的监测外,CDU的严密监控与管理是预防并尽早发现故障的关键。数据中心尤为关注泄漏问题,大部分泄漏案例发生在manifold与服务器软管快速断开附件处,对IT设备影响很小。但服务器机箱内部的泄漏,特别是发生在内部manifold、软管与冷板之间的泄漏,则对IT设备构成重大威胁。因此,实施额外过滤与传感器在内的防错系统至关重要,这些措施不仅能在热交换性能下降时提供预警,还能有效遏制人为错误导致的污染物增加或液体质量漏检风险,从而全面提升系统的稳定性与安全性。

节选自《智算中心液冷技术发展报告(2024 版)》

该报告深入分析液冷技术在智算中心的应用现状、技术发展和未来趋势。旨在为智算中心的规划和建设提供参考,帮助行业同仁更好地理解和应用液冷技术,推动AI行业的可持续发展。

相关推荐