马斯克追击万亿OpenAI

字母榜 2024-09-12 14:13:24

OpenAI很强,要给这种强悍标一个数,那这个数可能是1500亿美元。

当地时间9月11日,彭博社报道称,OpenAI正在以1500亿美元的估值进行融资,向投资者筹集65亿美元,还在商谈以循环贷款的形式向银行借款50亿美元。

OpenAI要融资的消息从八月底就开始传出,彼时媒体曝出的消息是“估值超过1000亿美元,筹集几十亿美元”,这已经给了外界不小的震撼。毕竟在去年底,员工出售现有股份时,OpenAI的估值是 860亿美元。

而据此前的消息来看,参与OpenAI本轮融资的巨头,除了微软之外,还有苹果和英伟达。估值大升、巨头押注,足见OpenAI的号召力。

故事的另一面,是OpenAI惊人的烧钱速度,和内忧外患的处境。

OpenAI上一次重要的融资发生在2023年1月,微软投资了约100亿美元。换句话说,OpenAI在不到两年里,烧掉了百亿美元。此前The Information就曾报道,OpenAI今年的亏损可能达到50亿美元,当时该媒体就预测,OpenAI很快就会需要融资,不幸言中。

内忧,OpenAI不仅更新速度减慢,还经历着频繁的高管出走。

2023年OpenAI上线GPT商店、发布GPT-4,忙得不亦乐乎。今年已经走过一大半,OpenAI的新产品多有热度没实物,Sora官宣于今年初,到现在连大规模测试都还没有进行;传闻许久的新模型“草莓”则更是神秘异常。

与此同时,11位联合创始人中,仍在OpenAI工作的只剩下2位。近日,GPT-4o和GPT-5背后的关键人物Alexis Conneau宣布离开OpenAI。

外患,谷歌、微软等巨头变相收购OpenAI的竞对们、硅谷的其他明星AI初创公司,Inflection AI和Character AI都已经有了实际上的“东家”。

更麻烦的是老冤家埃隆·马斯克(Elon Musk)已经从和OpenAI打嘴仗,变为真刀实枪地近身肉搏。

马斯克创办的xAI成立仅仅15个月,已经成为了OpenAI最强有力的对手之一。今年5月的B轮融资结束,xAI不仅以60亿美元单笔融资仅次于OpenAI,其估值也达到240亿美元,成为仅次于OpenAI的估值第二高的AI初创公司。

论产品,xAI的Grok模型经过多次迭代,目前Grok 2的性能表现已经紧追GPT-4。

就在明面上的战事胶着之际,埃隆·马斯克(Elon Musk)9月3日宣布,包含10万张英伟达H100的超算集群Colossus已经正式上线,论规模世界第一。

算力扩张服务于宏伟目标,Grok 3已经在路上,马斯克扬言要在今年年底开发出世界上最强大的人工智能。

长久困于算力的OpenAI已经和微软一起展开多个新的数据中心计划,或扩建已有的微软超算,或建立新的设施,更曾被曝有百万英伟达芯片的“星门计划”。

但筹建和“正式上线”的差别显见,在争分夺秒的AI赛场,时间不等人。据The Information,奥特曼已经向微软高层表达了对xAI算力超过OpenAI的担忧。

马斯克和奥特曼的算力战已经打响。

一个是“我不嫁豪门,我自己就是豪门”的马斯克,携xAI高歌猛进。一个是背靠巨头,依然是AI行业风向标的OpenAI。算力之战已经打响,而挑战不仅是有钱没钱。

A

马斯克和奥特曼都是OpenAI的联合创始人。二人曾在谷歌借DeepMind在人工智能领域出风头之际一拍即合,又在OpenAI非营利性机构走向有限商业化前夕分道扬镳。

ChatGPT两年前一炮而红,马斯克言语激烈地对OpenAI乃至奥特曼本人发起进攻,称OpenAI“违背初衷”,成为微软的附庸。后者是OpenAI最大的金主,投资了上百亿美元。

奥特曼多数时候表现平淡。但从奥特曼的只言片语中,也不难看出他对马斯克既嫌恶又无法轻视的矛盾情绪。奥特曼曾评价马斯克“是个混蛋(jerk)”。半年后,奥特曼谈起马斯克,又说了些好话:“埃隆绝对是一个人才吸铁石和关注焦点,而且他确实有一些真正的超能力。”

在这个时间点,马斯克的xAI已经成立,奥特曼很清楚这位硅谷狂人的能力。

在2023年7月正式宣布成立时,xAI被认为是剑指OpenAI的。马斯克对此也不避讳。

但彼时对于xAI,外界多持观望态度。毕竟它起步晚,规模也小。在OpenAI和微软之外,赛场上还有谷歌这样的巨头,以及Anthropic这样的明星初创企业。xAI不仅只有11位初始成员,理念上也天然排斥科技巨头的大笔投资注入。包括《连线》在内的一些知名媒体,讽刺xAI挑战OpenAI更多是马斯克的一种“幻觉”。

然而,xAI的发展速度之快超出了所有人的想象,正应了奥特曼对马斯克的评价——超能力。

梳理时间线不难发现,xAI产品发布和迭代速度很高。成立13个月,先后发布了首个Grok大模型、迭代的Grok 1.5、多模态的Grok 1.5V、Grok 2,以及小模型Grok 2mini。

深谙营销之道的马斯克给Grok鲜明的个性,用户在与Grok对话时,会发现这个机器人油嘴滑舌,冷嘲热讽,爱玩梗爱挑战“政治正确”。

然而,在戏谑的表皮之下,Grok模型一直紧咬OpenAI。

以最新战况为例。xAI在8月连发两款模型Grok 2和Grok 2 mini,编码、数学、推理方面性能较前代大幅提升,而且新增了文生图功能。彼时在LMSYS总榜单中,Grok 2早期版本sus-column-r排第三,上可以和GPT-4o掰手腕,下直接压过Anthropic的Claude 3.5 Sonnet。而在具体的使用中,Grok 2保持着“不正不经”的画风,新上线的生图功能,可以让AI“画”出别的知名大模型绕着走的图,比如马斯克持枪、迪士尼动画角色谋杀现场等,一度点燃网友整活的热情。

更让人出乎意料的是,xAI在今年5月完成了B轮融资,总融资额60亿美元。在大模型领域,这是仅次于OpenAI的单笔融资。OpenAI的总融资额为140亿美元,其中最大的一笔发生在2023年1月,由微软大手笔投资了100亿美元。

作为对比,在xAI的这次融资之前,单笔融资规模仅次于OpenAI的是Anthropic,其分别在2023年9月获得40亿美元融资,又在10月获得20亿美元融资,再随其后的是Inflection AI,2023年6月的单笔融资金额达到13亿美元。

其中xAI起步最晚,成立一年,却不仅拿出了紧咬OpenAI产品力的大模型,还在融资规模上紧随其后。

时至今日,xAI已经是OpenAI不可忽视的一个竞争对手,甚至是最有力的竞争对手之一。

B

不管是产品还是融资规模的比拼,都是二者的明战,在水面之下,xAI和OpenAI的算力暗战也激烈地进行着。

就在9月3日,马斯克在X上宣布,Colossus(巨人)已经正式上线。

Colossus是xAI的超级AI训练集群,位于田纳西州孟菲斯地区,由10万个英伟达H100 GPU。

并且,马斯克还承诺,未来的几个月里,Colossus还会继续加码,翻倍GPU,将整个集群的GPU数量增加到20万张,其中会有5万张英伟达H200。

10万张英伟达H100构成的集群是什么概念?

简单来说,目前世界第一。进一步说明,由于各大公司都在囤积GPU,实际活跃的GPU数量比较难看到公开数字。不过,去年6月时,融资13亿美元的Inflection AI曾经放出豪言,要打造“全球最大超算”,将由(仅)2.2万张英伟达H100组成。今年3月,Meta公布了两个数据中心新集群,每个包含2.4万张H100芯片。包含10万张及以上数量的英伟达芯片的超算,倒是有好几家公司正在筹建,但只有马斯克站出来说已经建成。

Colossus正式上线的惊人之处不仅在于其规模,还在于其落地所耗时间。用马斯克的话来说,团队建成Colossus仅仅用了122天,也就是4个月。一般来说,这种规模的AI训练集群怎么也得一年才能建出来。

马斯克首次对外透露xAI在建“算力超级工厂”是在今年5月。到了7月,马斯克就宣布包括xAI、X、英伟达在内的一些公司已经开始试用,彼时该集群被称作“孟菲斯超级集群(Memphis Supercluster)”。

“要么就赢,要么就别玩(Play to win,or don't play at all)。”马斯克6月的一条X信息是对其野心的最好诠释,而他更具体的计划是在今年12月前训练出“按每项指标衡量都是世界上最强大的人工智能。”

据马斯克自己所言,训练Grok 2需要2万张英伟达H100芯片,而训练Grok 3可能需要10万张H100。

要知道Grok 2的能力已经逼近GPT-4,不难看出,马斯克这回想要大力出奇迹。“最强大”的AI,要超过的关键目标是谁,也不言自明。

这样的消息,对于OpenAI来说自然也是一种压力。

根据The Information的报道,有知情人士透露,奥特曼已经对微软的高层表示过担忧,他担心xAI的算力很快就会超过OpenAI。

C

奥特曼有足够的理由担心。

目前,OpenAI的大模型迭代止步于“4”系列。而根据LMSYS于9月4日更新的全球排行榜来看,OpenAI的ChatGPT-4o-latest版本更新于今年8月8日,目前排名第一,但从综合得分来看没有与Gemini-1.5-pro、Grok-2拉开很大的差距。今年5月13日更新的GPT-4o排名第五。

可以说,从OpenAI去年3月发布GPT-4开始,人们就在等待GPT-5了。最初外界的共识是GPT-5将于2023年底或2024年夏天推出,但几个月前,OpenAI的首席技术官米拉·穆拉蒂(Mira Murati)已经公开表示,GPT-5可能会被推迟到2025年底或2026年底初发布。

而GPT-5推迟的原因,很有可能是“两个不足”,算力不足,数据不足。穆拉蒂透露,GPT-5的参数将会达到52万亿,相比于GPT-4的2万亿大幅增加。

不光是下一代GPT的开发需要充足的算力支持。今年3月,市场研究机构Facrorial Funds发布了一份报告,分析了OpenAI部署Sora所需要的硬件资源,认为峰值时期Sora预计需要72万张英伟达H100芯片来支持其运算需求。这份报告也能解释为什么Sora迟迟没有和大众见面。

OpenAI目前的算力主要来自于微软,或得益于微软的投资。2020年,微软建立了一台包含1万张显卡的超算,支持OpenAI的工作,这是当时全球五大最快的超算之一。

去年3月,微软公布了与OpenAI基础设施合作的新进展。最初的1万张CPU的超算已经升级,包括数万张A100芯片,系统成本“可能超过”几亿美元。

算力是奥特曼最常念叨的关键卡点。早在2023年5月,奥特曼就坐在美国国会听证席上表达了对算力瓶颈的担忧。

今年,奥特曼谈及算力时的表述更为宏大和坚定,他认为未来的两种“货币”将是算力和能源:“这(算力)可能是世界上最珍贵的商品,我们应该大力投资以进行更多的计算。”

3月时,奥特曼还发X消息抱怨没有足够的英伟达GPU来支持AI开发。有消息称,在那之后,OpenAI从微软获得了更多服务器使用权,到2025年中期,甲骨文和微软将为OpenAI提供全世界最强大的英伟达服务器集群之一,每年的租金约为25亿美元。

另据The Information的报道,微软正在酝酿更多升级,计划在2030年之前建造多个AI基础设施。

微软和OpenAI的算力计划可以分为五个阶段,目前双方正处于计划的第三阶段。第四阶段是微软正在为OpenAI建造的超算,计划2026年左右投入运营。威斯康星州经济发展局表示,微软在那里动工扩建了一座耗资10亿美元的数据中心,知情人士透露该数据中心最终成本可能高达100亿美元。

而第五阶段,则是轰动一时的“星际之门”计划。该计划在今年3月被媒体曝光:微软和OpenAI正在筹建拥有“百万”芯片的超算,项目成本可能高达1000亿美元。

在试图从外界获得更多算力资源之外,奥特曼也亲自上阵,试图推进他的芯片野心。奥特曼急于拥有自研芯片,以降低用芯成本,目前英伟达的高端AI芯片不仅价格高昂,且资源紧缺。

今年初,一则奥特曼欲打造7万亿芯片帝国的消息传出,但这过于宏伟和遥远。从各方报道来看,奥特曼最近一年在芯片问题上非常活跃,积极与各方谈判。

一方面是研发芯片。7月时,消息称OpenAI在内部建立芯片团队,由谷歌TPU前工程高级总裁理查德(Richard Ho)领导。而曾和谷歌合作制作TPU的博通,已经和OpenAI芯片团队交流。除此之外,博通的竞对也在向OpenAI推销自己的服务。

另一方面是生产芯片。据称奥特曼和主要芯片制造商和供应商高管谈判,想让他们提高产能,生产更多英伟达芯片,或者甚至是OpenAI的新型芯片,其中包括台积电。除此之外,今年早些时候,奥特曼可能已经和存储芯片制造商三星和SK海力士接触。

而奥特曼的第一步似乎马上就要落脚。近日,台湾经济日报报道称,OpenAI已经预定了台积电A16芯片,拟用于Sora。A16芯片是台积电目前已揭露的最先进制程节点,也是台积电迈入埃米制的第一步,预计2026年下半年量产。在OpenAI之外,苹果也是A16首批客户之一。

D

马斯克和奥特曼的算力较量已经如火如荼地展开,但算力扩张需要的不仅是金钱,他们各有各的“优势诅咒”。

马斯克手里的多家公司是他的优势,其中和xAI相关的主要是X和特斯拉。X可以为xAI提供数据和用户,特斯拉则更“有用”,不仅为xAI输送了至少11名成员,还可能直接为xAI提供GPU。此外,马斯克曾称特斯拉收集的大量视觉数据可以为xAI所用,用以训练大模型。今年7月,马斯克甚至在X上发布投票,问粉丝是否赞成特斯拉向xAI投资50亿美元。

但“左手倒右手”为马斯克带来便利,也带来麻烦。

特斯拉并不处于巅峰时期,相反,特斯拉电动汽车销售疲软,新款旗舰轿车车型迟迟没有推出。特斯拉的投资者对于特斯拉为xAI“输血”反应强烈,反对声不绝,甚至引发了多起诉讼。

争议之剧,让一向“头铁”的马斯克都不得不一度出面安抚特斯拉股东。此前马斯克让英伟达优先给xAI发货芯片的消息传出后,他解释特斯拉没有地方启动芯片,又强调特斯拉GigaTexas南部扩建工程将完工,还透露特斯拉今年会花费30亿到40亿美元采购英伟达芯片。

另一方面,马斯克带领xAI高歌猛进的另一大优势是“独立性”。不与科技巨头“同流合污”是马斯克与xAI占领舆论高地的方式,也有助于他吸引投资,成为制衡巨头的力量。

但这也意味着马斯克不会有如OpenAI、Anthropic、Inflection等初创公司的“金主”,后者都曾被巨头一次性注入过大笔资金。算力扩张之路是金子铺成的,光是10万张英伟达H100的成本就在25亿美元左右(除非英伟达提供批量折扣)。

OpenAI的一大优势是其背靠微软,在这家公司因ChatGPT走到聚光灯下的两年时间里,微软一直是其最重要的支持者。

但OpenAI和微软的关系亲密中带着微妙的尴尬,这已经是公开的秘密。

最直接的一个矛盾在于,OpenAI和微软既是合作伙伴,同时也相互竞争。也就是说,深度嵌入OpenAI模型的微软产品如Copilot、新必应,要和OpenAI本身抢客户。此前奥特曼飞往旧金山、纽约、伦敦等地,亲自给几百名来自《财富》500强企业的高管宣讲,推销OpenAI的企业级产品服务。

就在9月5日,OpenAI还高调宣布,一年前推出的企业版ChatGPT订阅服务,现在付费用户数量已经超过100万人。

而微软则已经在战略层面做出调整。此前微软变相收购了Inflection AI,将其人才几乎全数吸纳,并在内部建立了AI团队“Microsoft AI”,向其他巨头看齐。5月,The Information报道微软即将推出全新的AI模型,内部代号MAI-1,参数量500亿。

试问,如果微软有自己“亲生”的大模型,并且性能够高,又有什么理由不替换掉OpenAI?

况且,OpenAI特殊的治理结构给双方的合作中埋下了一个巨大的定时炸弹:按照约定,OpenAI对微软的授权,将随着AGI的来临而终止。

竭力提供金钱与算力,推动着OpenAI实现AGI,但同时也是推动自己失去OpenAI,这是微软面临的一个悖论。

而微软和OpenAI已经在筹建的和计划筹建的超算集群,涉及巨额的资金投入。就拿“星门计划”来说,项目成本1000亿美元,即便对微软来说,这也是一个不好承受的金额。微软2024财年(截至6月30日)资本支出557亿美元。

在算力扩张的路上,OpenAI要么得和微软关系“锁死”,要么就得尽快给自己找条出路,否则等待OpenAI的就是“成也萧何,败也萧何”的局面。

最后,在马斯克与奥特曼的算力较量中,还有一条拦路虎,名叫“能源”。

The Information估算,GPU 比传统芯片需要更多的功率,一个10万个芯片的集群可能需要 100 兆瓦的专用电源。这是传统数据中心消耗电量的 10 倍,可以为7万到10万个家庭供电。

马斯克的超大集群Colossus“已经上线”的真实性也因此受到了质疑。电力公司表示xAI到8月能获得大约50兆瓦的电力,在建的一个发电站倒是可以再提供150兆瓦电力,但2025年才能实现。

也有人猜测马斯克抛开电力公司,企图用化石能源发电机为集群供电,为此,田纳西州孟菲斯的环保组织还投诉了他。

这还不仅是xAI和OpenAI两家的问题。The Infomation统计,目前美国在7个州有17个正在使用或正在筹建的超算中心(不包括“星门计划”这种实现可能性存疑的项目),如果都投入运营了,美国能源部都吃不消,可能出现电力不足的情况。

马斯克和奥特曼打嘴仗仿佛还在昨日,如今却已陷入谨慎肉搏战。算力扩张往往以宏大叙事展开,以数十亿甚至数百亿美元的投入,竖起数万张甚至数十万张芯片的城墙。但在路途当中,二位还有很多关卡要过。

0 阅读:60

字母榜

简介:让未来不止于大。关注商业巨头的进化,生态和战争