前言,智算中心的建设在如火如荼的进行,能耗的快速增长成为智算产业发展不可忽略的问题,液冷技术凭借自身在散热方面的显著优势,或将成为未来主流的IT设备散热方案。国内外多家企业纷纷推出了液冷相关的产品和解决方案,以冷板式液冷方案为主已在智算中心领域有了一定规模的应用案例,今天我们以“冷板式”液冷为重点展开介绍一下,文末有学习资料分享。
图片来源:中兴通讯-液冷技术白皮书
一、冷板式液冷方案和原理概述
1、冷板式液冷散热的逻辑
冷板式液冷技术是通过冷板(通常是铜、铝等高导热金属构成的封闭腔体)将CPU、GPU等这类发热元器件的热量间接传递给封闭在循环管路中的冷却液体,冷却液带走热量,并将其传递到一次侧(一次侧和二次侧的定义下文会讲到)回路,通过冷却系统进行冷却,最后将热量排出系统。
因为冷却液并不与CPU、GPU等电子器件进行直接接触,而是通过液冷板等高效热传导部件将被冷却对象的热量传递到冷却液中,因此冷板式液冷技术又称为间接液冷技术。与传统的风冷技术相比,冷板式液冷散热效率更高。还可以减少机房的噪音和灰尘污染,提高智算中心整体环境品质。
2、冷板式液冷的方案设计
冷板式液冷系统可以分为一次侧(室外)循环和二次侧循环(室内)两部分。其中,二次侧循环主要通过冷却液温度的升降实现热量转移,而一次侧的热量转移主要是通过水温的升降实现。
一次侧系统:主要由室外散热单元、一次侧水泵、定压补水装置和管路等部件构成。一次侧冷源可采用自然冷却系统和机械制冷系统,以响应二次侧末端不同的温度需求。
-
自然冷却是在室外气象条件允许的情况下,利用室外空气的冷量而不需机械制冷的冷却过程,自然冷却系统可采用开式冷却塔、闭式冷却塔和干冷器等设备实现,可提供 30℃以上的冷却水。
-
机械制冷系统包括风冷冷冻水系统和水冷冷冻水系统,可提供 12℃℃-18℃℃的中温冷冻水。机械制冷是否需要是结合二次侧末端水温需求和项目地室外环境情况确定。
二次侧系统:主要由CDU冷量分配单元、机房分水管路和液冷机柜(含冷板、快接头和Manifold)等部件构成。二次侧液体回路是指从CDU到机架,通过循环管路和 IT 设备连接,然后再通过循环管路返回CDU的设计来自二次侧冷却回路的热量通过热交换单元的板式换热器传递到一次侧冷却回路,最终排放到大气中或被热回收再利用,
3、冷板式液冷的核心组成概述
换热冷板:常作为CPU、GPU等芯片的顶板,通过冷却介质在通道中的强迫对流,带走服务器的内部热量。冷板表面接近芯片温度,可带走大量的集中热量,从而有效降低智算中心的PUE值。由于冷板在工作过程中不直接接触发热元器件,因此避免了冷却介质对电子元器件的污染,提高了芯片的使用寿命。
冷量分配单元:(Coolant Distribution Unit,CDU)可以看二次侧部分与一次侧的连接点,CDU内部由板式换热器、电动比例阀、二次侧循环泵膨胀罐、安全阀、进出水管专用接头、控制器及其面板等部件组成。相当于液冷系统的心脏,实现冷却液循环和热量的交换,高温冷却液携带的热量在CDU中高效传递给一次侧,一次侧系统再通过室外机部分的系统循环将热量最终释放到自然环境中。降温后的冷却液由CDU的内置循环泵驱动进入服务器,使冷却液循环往复,源源不断地带走服务器热量。
分液循环管路:是连接换热冷板、冷量分配单元和室外冷源的必要部件,可以理解为液冷系统的“血管”。按连接方式不同,可分为直连式和环路式(下图是环路式)两种循环管路的可靠性主要取决于连接处的材料,在实际连接中,管路管件的材料均需考虑与冷却液的兼容性,在液冷机柜内部称为Manifold,为了维护上的便捷性往往搭配盲插的快接头。
二、冷板式液冷方案的冷却液选择
冷板式液冷技术的冷却液在冷板管路中流动,不与主板和芯片等直接接触,在满足冷却性能的前提下,可以只考虑冷却液与循环管路和冷板之间的兼容性和可靠性。但在实际操作中需要定期检查冷却液,确保冷却工质的品质稳定可靠,以降低在长期工作环境下腐蚀、加速老化、渗透等风险。在冷却液的选择上,常用的有水基冷却液和非水基冷却液细分如下:
1、水基冷却液:特点是具有良好的传热性能,分为纯水液和配方液。纯水液以纯水为溶剂,不添加任何其他材料或只依据防冻需求添加一定比例的乙二醇或丙二醇防冻剂,纯水液通过维持超低电导率环境抑制浸润材料的腐蚀和微生物的滋生。配方液以纯水为溶剂,依据防冻需求添加一定比例防冻剂,并添加缓蚀剂、杀生剂等添加剂,配方液通过添加剂降低浸润材料的腐蚀风险和抑制细菌生长。
2、非水基冷却液:主要分为碳氢及有机硅类以及碳氟化合物类,使用时需对材料的兼容性进行严格审查和测试。碳氢及有机硅类冷却液常温下呈黏稠状,因此被业内统称为“油类冷却液”常见的油类冷却液可以分为天然矿物油、合成油、有机硅油等,普遍具有沸点高不易挥发、不腐蚀金属、环境友好、毒性低等共性,且成本较低,但由于具有闪点,使用中有可燃助燃风险。油类冷却液因其粘度、粘性和易吸湿水解等问题一般不作为冷板式液冷的冷却液。
3、板式液冷系统安全设计:板式液冷系统采用三级防漏液设计,通过节点、机柜和机房三级防漏液设计,确保零漏液事故发生。节点底座全密封,能够导流和及时疏导漏液,防止漏液影响其他节点;机柜采用快接头漏液喷射设计,配备自动控制制冷液的电磁阀;机房采用双环路设计,保证单个机柜漏液隔离后不会影响其他机柜的正常运行。冷板式液冷系统可以实现漏液全监控。
三、冷板式液冷和浸没式、喷淋式液冷方案对比
目前液冷技术主要分为冷板式、浸没式和喷淋式三种。浸没式是将整个服务器或服务器组件完全浸入液冷剂中,通过直接接触来散热。喷淋式和浸没式液冷技术相较于冷板式液冷,在极高功率密度的情况下可以实现更高的散热效率。然而,喷淋式和浸没式液冷技术在实施和维护上相对复杂,涉及更多的安全和环境考虑,同时也需要更多成本投入,对比如下:
四、国内服务器液冷的市场情况
10月15日,IDC发布了《中国半年度液冷服务器市场(2024上半年)跟踪》报告。显示国内液冷服务器市场在2024上半年继续保持快速增长,市场规模达到12.6亿美元,与2023年同期相比增长98.3%,其中液冷解决方案仍以冷板式为主,占到95%以上。出货量方面,相较2023年上半年增长81.8%,全年有望突破23万台。?
注:本文中部分内容引用了信通院发布的《算力中心冷板式液冷发展研究报告(2024)》;大家如果想获取此报告,可关注我公众号后在消息栏发送“20241116液冷”,将自动获得资料的百度网盘下载链接!感谢支持!
—-老张会持续通过公众号分享前沿IT技术,创作不易,大家多多点赞和关注!
相关文章推荐!