最近英伟达GPU租赁价格的大幅下降,成了AI行业热议的焦点。有网文称当前态势为“英伟达GPU租赁泡沫破裂”,这一说法引发了广泛关注。
英伟达 H100 租金暴跌现象英伟达 H100 在 10 个月内租金猛降 50%,这一现象在行业内引起了广泛的热议。外网甚至用 “英伟达 GPU 租赁泡沫破裂” 来形容当下的趋势。据了解,英伟达 H100 一般以 8 卡为一个节点的形式出租,年初市场报价在 12 - 18 万 / 年之间浮动,如今却徘徊在 7 万元前后。
这种价格的暴跌并非毫无缘由。一方面,英伟达当下处于新旧产品交接期。今年的 Blackwell 架构新品 GB200 单位算力成本更低,大部分 AI 公司为降本考虑选择 “蹲新品”,使得老产品 H100 遇冷。尽管新品万众期待,但却面临尴尬延期问题,英伟达与台积电相互指责,导致新芯片推出时间推迟到第四季度甚至明年。有行业人士预测,GB200 正式面世后,老芯片租赁价格下跌态势很有可能进一步加剧。
另一方面,算力市场供给与需求不匹配也是重要原因。在国内,先搭好算力池子再发展 AI 应用的模式,导致最近两年涌现了 1.3 万个智算中心,国内算力规模已达全球第三,智能算力同比增速超过 65%。
在建设潮中,英伟达 H100 芯片被大量囤积。然而,原本最消耗算力的预训练诉求普遍下滑,推理和模型微调的需求虽有所反超,但未达 “爆发” 态势,使得大量算力短时间内无法被广泛的 AI 应用消纳,供需天平倾斜,价格下滑在意料之内。
英伟达H100为何不香了在过去,算力行业一项目普遍的商业模式是卖英伟达“裸金属”,行业俗称“卖铁”。但在算力行业供需变化的当下,纯卖硬件的模式过于简单粗暴,很难持续。尤其是,当英伟达租赁价格今年以来出现“崩盘”,下游AI行业对于算力芯片的观念也悄然发生变化。
如果说,前两年谁能买断更多英伟达芯片,就意味着谁就最有机会更快训出更强大的模型。而现在的AI公司们,更倾向于选择租赁芯片的方式获得算力,而非直接买断芯片重资产、挤占现金流。
为此,上游的算力行业也做出了相应调整来适应这种趋势,尝试推出更多元的租赁服务。
一位行业人士表示,过去AI厂商若租用英伟达卡,基本需要多个节点、按年起租。但今年的变化是,有算力需求的客户不仅变得分散,同时,他们对成本也变得格外敏感,分时租赁的要求变得很高。
“现在一些算力中心也允许你一次只租几张英伟达的卡、只租用几个小时”。这有点像,过去你需要按年整租一两层楼,但现在允许你短租一间房了。
不过,这种变化的直接后果是,算力行业的回本周期变得更长。有行业人士粗略测算,“一个用H100芯片搭建的算力中心,硬件回本周期高达5年以上”。与此同时,算力行业从业者们,正在尝试增加算力服务的颗粒度,有逐渐向上层的模型层、应用层延伸的趋势。
此外,一些智算中心运营方在卖算力之余,也会顺带帮助下游的AI客户做好模型的微调;或者直接深入几个对算力需求更强的行业,比如金融、医药、新能源,与具体的场景做结合,挖掘更多可以卖算力/租算力的潜在需求。
免责声明:
1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。
2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。
3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。