由于受生成式AI技术的影响,数据中心的算力需求呈现爆发式增长,随之而来的是功耗和散热的巨大挑战。
为应对这一挑战,英特尔推出了G-Flow浸没式液冷技术,在几乎没有新增成本的情况下,将散热能力最多提高两倍,可满足千瓦级功耗芯片的散热需求,为数据中心的散热难题提供了一个突破性解决方案。
从风冷转向液冷是大势所趋
当前,数据中心散热从风冷向液冷转变是一个明显的行业趋势。这不仅仅是因为液冷在降低数据中心PUE(电源使用效率)方面更有效,还因为从服务器运行的角度来看,液冷相比风冷在高效散热方面更具优势。
风冷可以提高风扇转速来提高散热效果,然而,这并非可持续发展。首先,提高转速带来的能耗增加是非线性的,而且,随着风速的提高,散热收益不断收窄。同时,风扇转速提高增加的噪音和震动,还会影响服务器的可靠性。
相比之下,液冷散热通过直接接触散热片的液体带走热量,通常具备更好的散热效果,能够压制更大的散热功耗。同时,液冷的方案不仅省去了风扇的噪音和震动,还能让芯片稳定维持在较低的温度区间,避免了瞬时温度升高,从而降低故障率,延长设备的使用寿命。
现阶段,第五代英特尔至强的TDP已经来到了350瓦,风扇需要在较高的转速区间才能满足这一级别处理器的散热需求。未来,随着更高TDP处理器的出现,而且考虑到还有包括GPU在内的各种AI加速器,单台服务器的功耗只会越来越高,由此可见数据中心急需由风冷向液冷的转化。
同时,绿色云图CEO 胡世轩还提到了业内对液冷市场的预测报告,报告指出,2023年是液冷的技术验证阶段,而后新建数据中心会有较大比例会采用液冷技术。
总之,在可见的未来,数据中心从风冷转向液冷是大势所趋。
常见的数据中心液冷技术方案
简单了解一下液冷。数据中心液冷技术主要分为浸没式和冷板式,每种又包含单相和双相两种。
先来看浸没式液冷。单相浸没式液冷可以使用合成油或氟碳化合物液体。其中,氟碳化合物散热效果更好,但易挥发的特性容易对环境造成影响,而双相浸没式液冷目前只能使用氟碳化合物。
冷板式液冷方案中,单相方案以水为导热介质,散热效果好且环境友好,但存在液体泄漏的风险。双相冷板方案也用了氟碳化合物,虽然散热能力更出色,但技术更新颖、更复杂,产业链还有待完善。
英特尔作为行业产业链纽带,素来与生态保持着密切沟通,如今也正以实际行动推动着液冷技术的落地和发展。在技术选型上,英特尔支持环境保护,希望减少或是禁止使用含氟化合物的方案。
埃克森美孚不仅是一家石油和天然气公司,也能提供散热用的冷却液。埃克森美孚产品解决方案业务部门亚太区产品总监王欣指出,合成油冷却液在安全性、性能和成本效益方面有显著优势,而氟化液有不易降解的有害物质,一些地区已经限制甚至禁止使用氟化液,所以,合成油冷却液是更好的选择。
考虑到环保需求,含有氟化液的双相散热方案,就远不如单相冷板和单相浸没式方案更具优势。如果同时又考虑到安全性,想要避免漏液风险,最好的选择就是采用合成油的单相浸没式液冷方案。
绿色云图CEO 胡世轩介绍称,2023年6月,三大运营商发布的《电信运营商液冷技术白皮书》明确了液冷技术的范围,只纳入单相浸没和冷板技术,排除了喷淋和相变等其他液冷技术。
事实上,单相浸没式液冷技术具备很多优势。最主要的是,它的技术相对简单,即将服务器完全浸没在冷却液中,服务器工作时产生的热量通过泵驱动冷却液循环,将热量带走,从而实现散热。
提高单相浸没式液冷的散热表现
从实际部署来看,单相浸没式液冷技术因其简单、可靠和成本较低而受到广泛关注和欢迎。然而,这一方案最大的问题是散热能力上限不高,而且,如果单纯通过提高液体流量来增强散热,效果并不明显。
英特尔资深技术专家表示研究后发现,即使提高液体流速,大部分的冷却液并不会流经散热器,无法带走更多热量,导致芯片温度只能降低1-2度。
这也主要归因于流经散热器的液体较少,因此,为提高流经散热器的液体流量,英特尔推出G-Flow浸没式液冷技术。通过在散热器和机柜液体出口之间建立一个连通的管道,利用重力或泵的吸力来加速流体通过散热器。
在这套方案中,冷却液从机柜底部泵入腔体,当冷却液超过散热器表面时,会沿着管道流下出口。这个过程主要依靠重力驱动,简单高效,流经散热片的液体也会增多。
英特尔资深技术专家表示,在液面高度差为1米的情况下,理论上可以将液体流速加速至4.4米/秒。而传统自然对流趋动下,液体流速仅为几毫米/秒,这套方案将流速提高了几百倍。
考虑到流体黏度和流动损失,即使达不到理论数值,也依然可以显著提高流速,提高流经散热器的液体流量,因为所有被泵入的液体都要经过散热器,最终大大提高了散热效率。
为了让这一技术真正快速用起来,英特尔考虑了设计要保持简单,成本要较低,客户实施的风险要低,同时,还要通过模块化设计提高系统的灵活性和适应性。
事实上,这套新的散热方案对服务器、对机柜的改动都非常小,可以在无需引入新技术的前提下完成。它与现有的冷板散热方案有些相似之处,但它只有出水管,没有进水管,也完全不用担心泄露导致短路。
对服务器而言,只需兼容新的散热器,底部支持新的转接板即可。机柜要做的就是增加固定转接板的构造。中间的转接板可根据服务器的具体形状和接口位置定制,确保在更换服务器时无需改动机柜结构。
英特尔资深技术专家表示,未来如果这一技术得到广泛认可,会进一步简化改造过程。
与产业伙伴合作来推广新技术
任何新技术都离不开产业生态各方的支持,为了验证和推广这项新技术,英特尔联合服务器合作伙伴,液冷技术提供商以及液冷产品解决方案供应商做了很多验证工作。
据了解,英特尔已经与新华三和中兴通讯两家服务器厂商合作,对服务器进行内部改造。秉承开放的态度,未来英特尔希望与更多服务器领域的合作伙伴展开合作。
为了确保冷却液的兼容性,英特尔还与埃克森美孚合作开展了一系列实验。埃克森美孚和英特尔在浸没式液冷方面有长期的合作关系,英特尔对其产品的各方面表现都非常有信心,其研发实力可以帮助解决在可靠性、兼容性等方面的问题。
从王欣的介绍中了解到,埃克森美孚有专门的团队负责液冷解决方案,埃克森美孚与包括英特尔在内的芯片厂商、液冷产业链厂商以及超大规模数据中心都有合作。针对浸没式液冷场景,埃克森美孚推出了EMDC系列产品来推动行业实现更高的散热表现。
此外,英特尔还与液冷产品解决方案供应商绿色云图和立讯技术开展了合作,这部分合作伙伴负责设计机柜和冷却分配单元(CDU),期间英特尔也与合作伙伴携手解决了很多在实践中遇到的问题。
在沟通过程中,绿色云图CEO 胡世轩表示看好液冷市场的未来发展,尽管现阶段冷板技术的应用比例略高,但浸没式液冷技术的需求增长速度也非常快。
今年4月,英特尔与生态伙伴合作推出了首台样机。目前,这台样机在实验室里已经顺利运行了两个多月,而且测试结果符合此前预期。
英特尔资深技术专家表示,这一方案可以把基于合成油的单相浸没式液冷的散热能力,其上限提高1倍甚至是2倍,可以满足千瓦级芯片散热需求。