AI数据中心GPU紧缺情况正在缓解,但电力将成新瓶颈

玩数据还有点懒 2024-07-31 20:30:38

马斯克和扎克伯都在讲同一件事,AI发展真正的瓶颈,不是GPU算力不足,而是电力。电力的供应不像GPU一样可以无限扩张,AI训练和推理的需求只会越来越大,但发电厂却没办法无限制的扩张发电机组,更不用说盖新电厂的难度。

算力或将重构电力需求结构

电力正在成为新的紧俏商品,AI数据中心正将电力需求的逻辑重构。

2020年,OpenAI预训练GPT-3这样的大语言模型参数达到1750亿,需要将近130万度电。而GPT预训练所需的参数已经从1750亿,提高至GPT-4的1.8万亿。再到GPT-5即将突破的10万亿,意味着只要生成式AI应用的范围越来越广,耗电量只会节节攀升。

Meta首席执行官扎克伯格今年5月在最新的采访中提到,建造AI数据中心的算力GPU供应紧张正在逐步缓解,但下一步电力将是发展瓶颈。“目前建立单一的数据中心功耗在50-150MW,如果发展到1GW级别的数据中心,将需要一整个核电站的发电机组为AI数据中心供电。”

这也意味着,除了芯片、算力的技术竞争之余,电力竞争也将重燃战火。

未来超大规模数据中心使用的总电力将增加一倍

根据预测,由于人工智能带来的核心驱动力,全球预计将额外建造120-130个超大规模数据中心。因此,因此,在未来四年中,由于机器的功率和计算密度的增长速度快于数据中心数量的增长,全球数据中心将增加50%至1500 个,但超大规模数据中心使用的总电力将增加一倍。

因此,超大规模数据中心的关键IT总负载容量为25GW至30GW,四年后可能会升至50GW 至60GW,而四年前可能仅为10GW至12GW。

数据中心世界将发生翻天覆地的变化——并不是因为公司没有数据中心,而是因为超大规模企业将进行大规模的 人工智能、GenAI建设,这对大多数企业来说成本太高且具有破坏性,以至于难以应对。

综合观察,人工智能浪潮的来临,使得AWS、微软Azure、谷歌云这些云服务巨头们正在加大对基础设施的投入,并且也在人工智能云服务上获得了快速增长。从长期的角度,各行各业对于人工智能的需求必然是长期的,不仅会带来基础设施层面的长期投入,也将逐渐演变成一项“资本游戏”,成为云服务市场最大的变量。

免责声明:

1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。

2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。

1 阅读:60

玩数据还有点懒

简介:感谢大家的关注