英伟达推动,2025年液冷散热渗透率超20%

袁遗说科技 2024-09-23 18:38:35

本文由半导体产业纵横(ID:ICVIEWS)综合

液冷散热方案的渗透率明显增长,从2024年的10%左右至2025年将突破20%。

TrendForce 最新调查,英伟达 Blackwell 新平台预定第四季出货,助益液冷散热方案渗透率明显成长,从今年10% 左右至2025 年突破20%。全球ESG 意识提升,加上CSP 加速布建AI 服务器,有助带动散热方案从气冷转向液冷。

观察全球AI服务器市场,今年主要AI方案供应商仍是英伟达。单就GPU AI服务器市场而言,英伟达有绝对领先优势,市占率逼近90%,排名第二的AMD仅约8%。

TrendForce观察,今年英伟达 Blackwell出货规模尚小,因供应链持续执行产品最终测试验证等流程,如高速传输、散热设计等有待继续最佳化。新平台因能耗较高,尤其GB200整柜式方案需更佳散热效率,有望带动液冷方案渗透率。然既有服务器生态系统液冷比例尚低,对漏液或散热效能不佳问题,ODM仍须历经学习曲线后得出最佳解。TrendForce预估2025年Blackwell平台高阶GPU占比有望超过80%,促使电源供应厂商、散热企业等将竞相投入AI液冷市场,形成新产业竞合态势。

台厂1H25有望供应快接头,Google积极布局液冷方案

近年Google、AWS和微软等大型美系云端企业皆加速布建AI服务器,以搭载英伟达 GPU及自研ASIC为主。TrendForce了解,英伟达 GB200 NVL72机柜热设计功耗(TDP)高达约140kW,须采液冷方案才能解决散热问题,以水对气(Liquid-to-Air,L2A)为主流。HGX和MGX等其他架构Blackwell服务器因密度较低,气冷散热为主方案。

就云端企业自研AI ASIC来说,Google TPU除了气冷方案, 也布局液冷散热,是最积极采液冷方案的美系企业,BOYD及Cooler Master为冷水板(Cold Plate)主要供应商。中国阿里巴巴最积极扩建液冷数据中心,其他云端企业AI ASIC主要仍采气冷散热。

TrendForce指出,云端企业将指定GB200机柜液冷散热方案的关键零组件供应商,冷水板主要企业为奇鋐及Cooler Master,分歧管(Manifold)是Cooler Master和双鸿,冷却分配系统(Coolant Distribution Unit ,CDU)为Vertiv及台达电。防漏水关键零件快接头(Quick Disconnect,QD)采购仍以CPC、Parker Hannifin、Denfoss和Staubli等国外厂商为主,中国台湾供应商嘉泽、富世达等在验证阶段,2025上半年台厂有机会加入快接头供应商行列,有助逐步缓解供不应求局面。

AI芯片过热怎么解?3种服务器散热方式一次看

在更深度切入散热赛局之前,必须先对散热方式有初步的了解,目前大致分为3种:气冷、液冷以及浸没式。

气冷散热:还是有高度市场需求

气冷是目前数据中心或是一般企业机房最广泛使用的散热方法,就像让服务器吹冷气,透过风扇、鳍片、导热管等方式带走热能。而气冷散热若要提高到最强的散热效果,就要使用到热管结合热板设计的高阶气冷技术3D VC(Vapor Chamber),并加上大量的风扇来散热。

虽然风量风速越快,热对流速度就越快,但是不可能一直无限上纲,震动、噪音都会为服务器或工作场域带来负面影响。

中国台湾气冷散热的元件供应商有奇鋐、双鸿、建准、尼得科超众、高力及台达电等。高力副总经理吴俊英表示,目前气冷散热在市场需求还是很有空间,因为H100芯片用气冷就可以散热,但当GB系列的芯片出货之后,液冷取代气冷的速度就会加快。

液冷散热:现在各家厂商追求的最大市场

液冷又称为直接式液冷(DLC,Direct liquid cooling),可细分成水对气和水对水。

水对气:利用水冷管线带走芯片的热能之后,变热的水再透过水管传送到机柜后的风扇背门,将热能吹散,进而达到散热效果。

水对气的散热方案是现有数据中心在气冷散热的物理极限下,所因应的对策。因为不需要大规模修改机房或者服务器的机柜设备,只要加装一个风扇背门,就可以加强散热效果,目前约有6~七成的数据中心还是使用这样的散热方式。

然而水对气虽然是目前的最适解,却也不是最佳解,加装的风扇墙会让机房噪音达到90~100分贝(车水马龙的路旁大约是80分贝),工作人员根本无法在机房内长时间作业。

水对水:将装满冷却液的密封管线(或称封闭式冷却回路)环绕在服务器内最容易发热的关键零组件附近,零组件透过导热铜片将热能传导到冷却液,再透过液冷管线进行冷热液体的交换循环。与水对气最大的差异在于,服务器机柜背后不需要再使用风扇墙,大大提高机房空间使用率和降低机房噪音。

英伟达的高阶芯片GB200 NB072就是采用水对水的液冷散热。而此架构也是目前许多服务器代工厂商,如超微、技嘉子公司技钢、纬颖、英业达、云达等已投入的技术。

浸没式散热:是未来散热圣杯?

浸没式冷却,顾名思义就是将整台服务器放进不导电的液体当中,就像泡澡一样解热,且不只解决芯片的热,连同CPU、存储等各种服务器中的电子设备,都可以进行散热。

中国台湾的浸没式厂商包含技钢、光宝科、台达电、纬颖等。然而浸泡的液体(介电液)带来的环保问题、服务器内的电子设备是否可以长时间浸泡、后续服务器的保养该由谁来维护等,浸没式还有很大一段路需要克服。

数据中心在导入浸没式方案时,也必须考量到工厂楼层耐重程度,以及电路和水路的机房基础设施等。也就是说,若想要导入浸没式方案,就必须重新规划厂房,所耗费的成本非常庞大。

1 阅读:61

袁遗说科技

简介:感谢大家的关注