720亿、算力大单:黄了。。。。

聊点云上事儿 2024-07-11 17:42:20

Elon Musk 表示其名下的 xAI 将减弱依赖 Oracle 的云服务。

云头条

从而危及 Oracle 可能丰厚的收入来源,股价跌幅高达 4.8%。

2024 年 7 月 10 日,Musk 在其社交网络 X 上发帖称,xAI 决定在田纳西州孟菲斯自建一个内部训练 AI 模型的系统,将是世界上功能最强大的超级计算机,因为“我们的根本竞争力有赖于动作比其他任何 AI 都要快。”

Musk 表示,他预计这台超级计算机将于 2025 年秋天开放使用。

IT 外媒《The Information》早些时候报道称,两家公司已终止了一项可能价值高达 100 亿美元(727.6 亿元人民币)的云计算协议的谈判。

Oracle 董事长 Larry Ellison 去年 9 月还表示,Oracle 已达成了协议,将为 Musk 的 xAI 提供云基础设施,用于训练模型。Ellison 当时并没有透露这份合同的金额或期限。Musk 在帖子中表示,xAI 的 Grok 2 模型在 Oracle 的 24000 块英伟达 H100 芯片上进行了训练,“可能准备下个月发布”。

彭博行业研究(Bloomberg Intelligence)的分析师 Anurag Rana 撰文道,Musk 决定在内部建造 AI 训练基础设施,恰恰表明了云计算提供商面临的扩张挑战,尽管它们资金充裕。“我们认为,这些问题不单单影响 Oracle,还会困扰微软和 AWS,不仅仅是由于专用芯片短缺,还由于电力不足。”

今年 5 月,《The Information》报道称,Oracle 和 xAI 即将达成一项协议,以深化双方的合作关系。据知情人士声称,xAI 将花费约 100 亿美元从 Oracle 租用云服务器,为期数年。

这家 IT 外媒在 Musk 发帖子之前报道,这方面的谈判现已结束。

Musk:

xAI 与 Oracle 签约租用了 24000 块 H100,Grok 2 使用这些芯片进行了训练。Grok 2 正在进行微调和 bug 修复。可能准备下个月发布。

xA 正在自行建造一个由 10 万块 H100 组成的系统,力求在最快的时间内完成。计划在本月晚些时候开始训练。它将成为全球功能最强大的训练集群,遥遥领先其他同类集群。

我们之所以决定在内部搞 10 万块 H100 组成的集群和下一个重大集群系统,原因就在于,我们的根本竞争力有赖于速度比其他任何 AI 公司都要快。这是迎头赶上的唯一办法。

Oracle 是一家伟大的公司,还有另一家公司也有希望参与这个 OpenAI GB200 集群,但是,当我们的命运取决于做到全球速度最快的时候,我们就必须把自己的手放在方向盘上,而不是坐在汽车后座对驾驶员指手划脚。

Musk 声称,xAI 将在接下来的几个月部署一个由 100000 块 H100 组成的液冷训练集群,并在明年夏天之前部署另一个由 300000 块 B200 组成的集群。

xAI 还使用 AWS 和 X/Twitter 数据中心的闲置容量。

报道一出,Oracle 股价盘中跌至 138 美元这一低位。Oracle 股周一收于 145.03 美元,今年以来累计上涨 38%。

0 阅读:0

聊点云上事儿

简介:感谢大家的关注