|
摘要
随着信息技术的飞速发展,数据中心、高性能计算、电力电子及储能系统等领域的热流密度急剧攀升,传统风冷及间接液冷技术已难以满足日益严苛的散热需求。浸没式冷却技术作为一种直接液体冷却方案,将发热元件直接浸入介电冷却液中,利用液体相变或单相对流换热实现高效热管理,具有散热能力强、能耗低、噪声小、空间利用率高等显著优势。本文系统阐述了浸没式冷却技术的基本原理与传热机理,详细介绍了单相浸没式与两相浸没式两种主要技术路线的系统构成与关键部件,深入分析了该技术在数据中心、高性能计算、电力电子、电动汽车及储能系统等领域的应用现状与适用性,探讨了当前面临的技术挑战(如冷却液性能、密封与兼容性、沸腾传热强化等),并对未来发展趋势(如碳中和驱动、智能化热管理、新型冷却液开发及系统标准化)进行了展望。本综述旨在为浸没式冷却技术的研究者、系统设计者及行业应用者提供系统的理论参考与技术指南。
关键词:浸没式冷却;数据中心;介电冷却液;单相液冷;两相液冷;沸腾传热;热管理
第一章 引言
1.1 研究背景与意义
过去二十年,计算能力的指数级增长伴随着芯片热流密度的急剧攀升。中央处理器(CPU)和图形处理器(GPU)的热设计功耗(TDP)已从早期的几十瓦攀升至目前的300-700瓦,而下一代人工智能(AI)加速芯片和超级计算机处理器的热流密度预计将突破200 W/cm²。与此同时,数据中心的总能耗占全球电力消耗的比例持续上升,其中冷却系统能耗占比高达30-40%。传统风冷技术受限于空气的低热容和低导热系数,在有限空间内已接近其散热能力极限。
浸没式冷却技术应运而生。该技术将电子元件或发热部件直接浸入绝缘冷却液中,通过液体与固体表面的直接接触高效带走热量。相比于风冷和间接液冷(如冷板式液冷),浸没式冷却消除了界面热阻和中间热沉,可实现高达1000 W/cm²以上的热流密度处理能力,同时大幅降低泵功和风扇噪声。更重要的是,由于去除了高功耗的风扇和精密空调系统,浸没式冷却数据中心的电源使用效率(PUE)可低至1.05以下,逼近理论极限1.0。
1.2 浸没式冷却技术的发展历程
浸没式冷却的概念可追溯至20世纪中叶的大型变压器和电力电子设备,它们使用矿物油作为绝缘和冷却介质。然而,在信息技术领域的大规模应用始于21世纪初。2010年前后,美国绿色革命冷却公司(GRC)和液冷公司(LiquidCool)等初创企业开始商业化推广单相浸没式冷却系统。与此同时,以3M公司Novec系列氟化液为代表的两相浸没式冷却液进入市场,利用液体的沸腾潜热实现极高效率的散热。
近年来,随着比特币挖矿和高性能AI计算的兴起,浸没式冷却在矿业和超算中心得到快速部署。谷歌、微软、阿里巴巴等云服务巨头纷纷开展了浸没式冷却的示范应用。2021年,微软在其Azure数据中心部署了两相浸没式冷却系统,成为行业标志性事件。当前,浸没式冷却正从数据中心向边缘计算、5G基站、电动汽车电池热管理等领域加速渗透。
1.3 技术分类与基本特点
浸没式冷却根据冷却液在换热过程中是否发生相变,分为单相浸没式冷却和两相浸没式冷却两大类。
单相浸没式冷却:冷却液在整个循环中保持液态,通过泵驱动液体流经发热元件,升温后的液体经外部换热器(干冷器或冷却塔)降温后返回液槽。典型冷却液包括矿物油、合成油、天然酯等。其系统结构简单,控制方便,但散热能力受限于液体的对流换热系数。
两相浸没式冷却:发热元件使冷却液沸腾产生蒸汽,蒸汽上升至冷凝器(通常安装在液槽顶部)凝结为液体,依靠重力或毛细力回流。典型冷却液为低沸点氟化液(如Novec 7000,沸点34℃;Novec 7100,沸点61℃)。两相冷却利用潜热,传热系数高,可实现被动循环(无泵),但对密封和蒸汽管理要求较高。
两种技术路线各有优劣,表1-1给出了简要对比(文中以文字描述):单相浸没式系统压力接近常压、冷却液兼容性好、部署成本较低,但泵功消耗较高;两相浸没式系统传热效率极高、可实现被动冷却,但冷却液成本昂贵、蒸发损失需管理。
第二章 传热原理与机制
2.1 单相对流换热
单相浸没式冷却中,发热元件表面的热量通过导热传递到与之接触的液体层,然后由液体的对流将热量带离表面。对流换热遵循牛顿冷却定律:
q = h (T_s - T_f)
其中q为热流密度,h为对流换热系数,T_s为固体表面温度,T_f为液体主流温度。
在强制循环条件下,液体的流动状态(层流或湍流)对h有决定性影响。浸没式冷却中常见的流动构型包括:液体平行流过芯片表面(类似外掠平板)、喷射冲击(jet impingement)、以及通过微通道增强的流动。由于介电冷却液(如油和氟化液)的导热系数和比热容通常低于水,要达到相同散热能力需要更高的流速或更大的换热面积。
强化单相对流换热的常用方法包括:在芯片表面加工微肋片或微柱阵列,增加有效换热面积并扰动边界层;优化液槽流道设计,避免流动死区和短路;采用射流阵列实现局部高换热系数(可达10^5 W/m²·K量级)。
2.2 沸腾传热
两相浸没式冷却的核心是核态沸腾传热。当发热表面温度超过液体饱和温度(且有一定过热度)时,表面微小空穴(汽化核心)中形成气泡,气泡生长、脱离并向上运动,带走大量汽化潜热。
核态沸腾传热系数远高于单相对流,典型值可达10^4-10^5 W/m²·K。著名的Rohsenow关联式描述了沸腾热流密度与壁面过热度的关系:
q = μ_l h_fg [g(ρ_l - ρ_v)/σ]^0.5 [(c_p,l ΔT)/(C_sf h_fg Pr_l^n)]^3
其中,ΔT = T_s - T_sat为过热度。该式表明,沸腾换热强烈依赖于液体物性(表面张力σ、潜热h_fg、密度差)和表面特性(经验常数C_sf)。
随着热流密度增加,沸腾进入不同阶段:孤立气泡区、合并气泡区、直至临界热流密度(CHF)点。超过CHF后,表面被蒸汽膜覆盖,传热急剧恶化(膜态沸腾),导致元件温度骤升甚至烧毁。因此,CHF是两相浸没式冷却的安全上限,设计时必须留有足够裕度。
2.3 临界热流密度与强化
CHF是两相冷却系统的关键参数。对于浸没式冷却,CHF受限于液体从加热表面到液池主体的补充能力。Zuber公式给出了光滑平面上的CHF预测:
q_CHF = 0.149 h_fg ρ_v [σ g (ρ_l - ρ_v)/ρ_v^2]^0.25
对于典型氟化液,光滑表面CHF约为10-20 W/cm²,这远低于芯片热流密度需求(50-200 W/cm²)。因此,必须通过表面工程和结构设计来大幅提升CHF。
强化沸腾传热的方法可分为两类:表面微观结构改性和宏观结构设计。前者包括在芯片表面制造多孔层、微纳复合结构、或烧结金属颗粒层,增加汽化核心密度并促进毛细补液;后者包括引入微肋片、针鳍阵列或金属泡沫,增加有效面积并引导液体流向热点区域。研究表明,通过优化表面结构,CHF可提高至150-300 W/cm²。
2.4 相变传质与蒸汽输运
在两相浸没式冷却系统中,蒸汽的生成和输运对系统稳定性至关重要。气泡在加热表面形成后,经历生长、脱离、上升、聚并等过程,最终到达液池上方的冷凝器。如果蒸汽无法顺畅排出,会在加热表面附近形成积聚,阻碍液体补充,诱发沸腾不稳定性(如压力振荡、温度波动)。
液池高度、液体粘度、表面张力、加热面取向等因素都会影响气泡行为。在密闭系统中,蒸汽压力会升高,从而提升饱和温度(Clausius-Clapeyron关系),改变传热特性。设计时需通过计算流体动力学(CFD)模拟优化液槽几何,确保气泡路径畅通。
第三章 系统构成与关键部件
3.1 单相浸没式冷却系统
单相浸没式冷却系统的典型构成包括:液槽、循环泵、干冷器(或冷却塔)、热交换器、过滤装置及控制系统。
液槽:容纳服务器或电子设备的密封容器,通常由不锈钢或工程塑料制成,具备进出液口、电缆密封接口、检修盖等。液槽设计需考虑液体流动均匀性,避免局部热点。对于可扩展的大型系统,常采用机架式液槽,多个液槽并联接入循环回路。
循环泵:提供液体循环驱动力。由于介电冷却液粘度可能高于水(尤其是低温下),泵选型需考虑介质兼容性和粘度特性。变频泵可根据负载调节流量,实现节能。
干冷器/冷却塔:将液体吸收的热量排放到大气中。干冷器适用于缺水地区,但效率受环境干球温度影响;冷却塔利用蒸发冷却可获得更低的水温,但需考虑补水和水处理。
板式换热器:隔离服务器侧冷却液和环境侧冷却水(或制冷剂),防止污染和泄漏。对于采用水冷干冷器的系统,换热器是关键部件。
过滤与维护系统:浸没式冷却液长期与电子元件接触,可能积聚颗粒物、水分或降解产物。旁路过滤器可在线去除杂质,延长冷却液寿命。
3.2 两相浸没式冷却系统
两相系统通常采用“开放式液槽”或“密封式机柜”设计,核心部件包括:密封液槽、冷凝器、不凝性气体排放装置、液体回收系统。
密封液槽:必须承受可能的蒸汽压力(一般设计压力低于0.5 MPa),具备可靠的密封结构防止冷却液蒸汽逸散。电缆和光缆接口需采用密封穿墙件。
冷凝器:通常安装在液槽顶部或集成在盖板上,可采用水冷或风冷。水冷冷凝器换热效率高,但需要冷却水回路;风冷冷凝器结构简单,适合小型部署。冷凝器表面需做疏液处理,促进凝结液滴落回流。
不凝性气体排放:系统内空气或非凝结气体会积聚在冷凝器中,降低换热效率。需配备自动排气阀或定期抽真空。
液体补充系统:尽管两相系统设计为闭式循环,长期运行仍可能有微量蒸汽逸散(通过密封件)。储液罐和浮球阀可自动补充冷却液。
3.3 冷却液的分类与选择
冷却液是浸没式冷却技术的核心,其性能直接影响系统可靠性、散热能力和环境影响。
烃类油:包括矿物油、硅油、合成酯等。优点:价格低廉(约5-15美元/升)、介电强度高(>30 kV)、材料兼容性好、无毒无害。缺点:粘度较高(增加泵耗)、比热容较低、易燃(闪点>150℃可接受)、长期运行可能产生油泥。代表性产品:Shell Diala S4,Mobil 1等。
氟化液:包括全氟聚醚(PFPE)、氢氟醚(HFE)、全氟酮(PFK)等。3M公司的Novec系列和Fluorinert系列是典型代表。优点:化学惰性、极佳介电性能、低沸点可选(实现两相冷却)、不可燃。缺点:价格昂贵(100-500美元/升)、全球变暖潜能值(GWP)较高(部分HFE)、臭氧层破坏潜能(ODP)虽为零但环境问题受关注。Novec 7100(HFE-7100)的GWP约320,Novec 649(PFK)的GWP仅1,是更环保的选择。
天然酯:源自植物油的介电液(如大豆油、菜籽油酯化物),兼具可生物降解、高闪点和良好介电性能。适用于对环保要求严格的场合,但氧化稳定性有待提高。
新型冷却液:包括离子液体(室温熔盐,极低挥发性和不可燃)、纳米流体(添加高导热纳米颗粒增强换热)、液态金属(如镓基合金,导热系数极高但密度大、腐蚀性强)。这些尚处研究阶段。
选择冷却液需综合权衡:散热需求(单相还是两相)、工作温度范围、成本、环保法规、材料兼容性(与PCB、密封件、电缆的相容性)以及长期运行稳定性。
3.4 辅助系统与安全设计
浸没式冷却系统还需考虑以下辅助系统:泄漏检测系统(液体和蒸汽传感器)、压力释放阀(两相系统)、灭火系统(尽管冷却液不可燃,但服务器内部其他材料可能燃烧)、冷凝水预防(低温启动时)、EMI屏蔽(金属液槽本身可提供电磁屏蔽)等。
对于两相系统,还需监控蒸汽浓度和氧气含量,确保操作人员安全(氟化液高温分解可能产生有毒气体)。
第四章 应用领域
4.1 数据中心
数据中心是浸没式冷却技术最主要的应用市场。传统风冷数据中心PUE通常在1.5-2.0之间,而浸没式冷却可将PUE降至1.05以下,节能效果显著。
单相浸没式在数据中心的应用:适用于高密度机柜(20-100 kW/机柜)部署。典型案例包括阿里巴巴的浸没式液冷数据中心(位于浙江千岛湖,采用天然冷水源)、GRC的IceRack系统等。单相系统的优势在于部署相对简单,可使用成本较低的油类冷却液,且服务器硬件改动较小(只需移除风扇和散热器,改用导热垫与液槽接触)。
两相浸没式在数据中心的应用:适用于超高热密度(>100 kW/机柜)场景。微软在2021年宣布其Azure数据中心采用两相浸没式冷却,使用3M Novec 7100冷却液,实现了无风扇、无泵的被动冷却,服务器功耗降低5-15%(因为无需芯片风扇)。两相系统的挑战在于:服务器必须完全密封以适应可能的低压环境,且冷却液成本高昂。
经济效益分析:尽管初始投资(冷却液和液槽)高于风冷,但浸没式冷却通过消除精密空调、减少占地(可堆叠更高机柜)、降低电费(PUE降低节省30-40%电费)和延长设备寿命(无风扇振动、无灰尘腐蚀),通常在2-3年内可收回额外投资。
4.2 高性能计算与超算
超级计算机的芯片密度和功耗远高于普通数据中心。例如,AMD的MI300X GPU TDP达750W,英伟达的B200预计超过1000W。浸没式冷却已成为下一代超算的必选方案。
典型部署:日本理化研究所的“富岳”超算采用部分液冷,但其下一代系统计划采用浸没式。中国“神威·太湖之光”的后续型号也探索了浸没式方案。浸没式冷却消除了CPU和GPU的热节流(throttling),使芯片可长时间运行在峰值频率。
特殊考量:超算往往需要维护和升级节点,浸没式系统需设计快速吊装机构(避免排干全部冷却液)。对于两相系统,打开液槽前需排空蒸汽并冷却。
4.3 电力电子与新能源
电动汽车:功率半导体(IGBT、SiC MOSFET)在快充和急加速时产生大量热量。浸没式冷却可直接应用于逆变器和电机控制器,提高功率密度和可靠性。特斯拉已申请相关专利。此外,动力电池的浸没式热管理也在研究中——将电池模组浸入介电液中,利用液体的大比热容吸收快充热量,同时防止热失控蔓延。浸没式可使电池温度均匀性显著改善(温差<2℃),延长循环寿命。
充电桩与储能系统:大功率直流快充桩(350-500 kW)的散热需求迫切,浸没式冷却可使充电模块无风扇运行,提高防尘防水等级(IP65以上),适应户外恶劣环境。储能系统中的电池簇采用浸没式冷却,可提升安全性(液体阻隔氧气,抑制热蔓延)。
风电变流器:海上风电机组维护困难,要求高可靠性。浸没式冷却可隔绝盐雾腐蚀,同时高效散热,延长变流器寿命。
4.4 其他新兴应用
边缘计算与5G基站:边缘节点部署在户外或灰尘环境,风冷易堵塞。浸没式密封设计可实现免维护运行。已有厂商推出浸没式5G基带单元(BBU)冷却方案。
激光器与光学设备:高功率光纤激光器和半导体激光器热流密度极高,浸没式冷却(尤其是两相)可维持波长稳定性和输出功率。
航空航天电子:机载雷达和航电系统对重量和体积敏感,浸没式冷却通过直接接触消除散热器,提高功率密度。但需解决低气压(高空)下的沸腾行为变化问题。
加密货币挖矿:ASIC矿机热密度极高,浸没式冷却已是矿场标配。单相矿物油冷却大幅降低风扇噪声,便于居民区部署。
第五章 技术挑战与解决方案
5.1 冷却液性能瓶颈
当前冷却液无法同时满足所有理想特性:低粘度(降低泵耗)、高比热容和高导热系数(提高单相换热能力)、适当沸点(两相)、低GWP、低成本。氟化液虽有优异电绝缘性,但价格昂贵且环境问题日益突出(欧盟正在限制某些HFE的使用)。油类冷却液价格低但易降解、粘温特性差(低温时流动性差)。
解决方案:开发新型合成酯类油,优化添加剂配方抑制油泥生成;探索环保型氟化液(如全氟酮,GWP=1);研究纳米流体增强传热,但需解决纳米颗粒分散稳定性和电绝缘问题。
5.2 密封与材料兼容性
浸没式冷却要求所有浸入部件(PCB、连接器、电缆、电容、电源模块)与冷却液长期兼容。某些冷却液可能引起塑料溶胀、橡胶密封件老化、标签脱落、焊点腐蚀等。电解电容的密封塞在油中可能溶解,导致电容失效。
解决方案:建立材料兼容性数据库,制定浸没式冷却硬件设计指南。服务器制造商(如Dell、HPE)已推出“液冷就绪”服务器,使用耐液材料并移除敏感部件(如电池、风扇)。对于现有硬件改造,需进行长期浸泡测试(至少1000小时)。
5.3 沸腾传热强化
如前所述,光滑表面的CHF远低于高功率芯片需求。即使采用表面处理,大尺寸芯片(如GPU,面积>800 mm²)的沸腾均匀性也是难题——边缘和角落气泡脱离困难,可能导致局部干涸。
解决方案:研发多层微孔涂层(烧结铜粉、电沉积多孔层)、微柱阵列(高度100-300μm,间距50-100μm)以及双尺度结构(微米孔+纳米线)。这些结构通过毛细力促进液体向加热面补给,大幅提升CHF。此外,在芯片表面加工槽道或引入人工汽化核心(如激光打孔)可引导气泡有序脱离,减少相互干扰。
5.4 系统集成与标准化
浸没式冷却系统与现有数据中心基础设施(服务器机架、配电、网络布线、消防)的集成缺乏统一标准。不同厂商的液槽尺寸、接口、冷却液互不兼容,阻碍了大规模推广。
解决方案:开放计算项目(OCP)已成立浸没式冷却子组,正在制定液槽尺寸、服务器接口、冷却液规范等标准。2022年发布的OCP浸没式冷却规范V1.0定义了单相油冷和两相氟化液系统的技术要求。行业需进一步推动冷却液回收和再生标准,降低全生命周期成本。
第六章 未来展望
6.1 碳中和驱动下的技术演进
全球数据中心碳中和目标(如中国“东数西算”工程要求PUE<1.2)将加速浸没式冷却的部署。未来十年,浸没式冷却在新建数据中心的渗透率有望从目前的不足5%提升至30%以上。两相浸没式冷却因无水消耗(干冷器可风冷)在缺水地区优势明显。
余热回收:浸没式冷却的出口液体温度较高(单相可达50-60℃,两相冷凝温度约40-50℃),具备余热利用价值。可将热量用于建筑供暖、生活热水或工业干燥。微软在芬兰的数据中心将余热接入区域供暖网络。未来,浸没式冷却与热泵结合,可进一步提升能源利用效率。
6.2 新型冷却液开发
下一代冷却液将聚焦于环保性与性能的平衡。重点关注:
低GWP氟化液:氢氟烯烃(HFO)类物质,如R1234ze(E),GWP<1,沸点约-19℃不适合两相浸没(需加压),但可通过共混调节沸点。
液态金属:镓基合金(如GaInSn)导热系数约30 W/m·K,是水的15倍,且具有良好导电性(需绝缘封装)。若能将芯片封装在绝缘层内浸入液态金属,散热能力将远超现有技术。
磁性冷却液:含磁性纳米颗粒的液体,可通过外加磁场强化对流或实现定向流动,属于主动型智能冷却液。
6.3 智能化热管理
浸没式冷却系统将集成大量传感器(温度、压力、流量、介电常数、气泡探测等),结合机器学习算法实现动态热管理。例如:
热点预测与流量调节:基于负载预测,提前增加热点区域的局部流速或激活射流。
沸腾状态监测:通过声发射传感器识别气泡脱离频率,判断是否接近CHF,自动降频或启动备用冷却。
故障诊断与寿命预测:分析冷却液介电常数变化趋势,预测油品老化或氟化液分解,提示维护。
数字孪生技术将构建冷却系统的虚拟模型,实时优化运行参数,实现最低PUE。
6.4 标准化与生态建设
未来5-10年,浸没式冷却将完成从定制化到标准化的转型。主要方向包括:
液槽外形尺寸标准化:兼容19英寸机架,支持不同深度服务器混插。
冷却液接口标准化:快速接头、干式断接阀实现热插拔。
安全规范完善:修订电气安全标准(如IEC 60950)以涵盖浸没式设备,明确介电强度和漏电流限值。
运维流程标准化:制定冷却液更换周期、清洗方法、回收处置的行业指南。
随着标准成熟,浸没式冷却的部署成本将进一步下降,推动其在中小型数据中心和边缘节点的普及。
第七章 结论
浸没式冷却技术以其卓越的散热能力、显著降低的能耗和空间利用率优势,正在重塑高热流密度电子设备的热管理格局。本文从传热原理、系统构成、应用现状和未来趋势四个维度对浸没式冷却技术进行了系统综述。
在传热机理层面,单相对流和两相沸腾分别适用于不同的热流密度范围。单相系统结构简单、成本可控,适合20-100 W/cm²的热流密度;两相系统利用潜热传热,可处理超过200 W/cm²的热流密度,但需解决沸腾强化和蒸汽管理问题。冷却液是核心要素,烃类油主导单相市场,氟化液在两相领域不可替代,但环保型冷却液的开发刻不容缓。
在应用层面,数据中心是当前最大规模的应用场景,浸没式冷却可实现PUE<1.05的极致能效。高性能计算、电动汽车、储能系统等新兴领域的需求正在快速增长,浸没式冷却不仅解决散热瓶颈,还带来可靠性、寿命和功率密度的全面提升。
尽管面临冷却液成本、材料兼容性、沸腾强化和标准化等挑战,但在碳中和目标和AI算力爆发的双重驱动下,浸没式冷却正迎来发展的黄金时期。未来,随着新型冷却液、智能热管理和标准化生态的成熟,浸没式冷却将从利基市场走向主流,成为高功耗电子设备热管理的首选方案。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-15 02:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社