“DeepSeek,AI界的黑天鹅”
5000亿美元的星际之门
唐纳德·特朗普宣布了星际之门计划。目前的投资者包括OpenAI、软银、甲骨文和总部位于阿布扎比的投资基金MGX。初始投资为1000亿美元,到2029年预计将达到5000亿美元。DeepSeek横空出世
仅两天后,我国AI初创公司Deepseek发布了开源AI模型R-1,这是一个类似于GPT-4o的推理模型,随后又发布了一个名为Janus Pro的图像生成模型。两者都不是同类中绝对最好的,但都名列前茅。他们最具颠覆性的是其开发成本。训练成本打破认知
在今年1月之前,几乎没有人听说过Deepseek,但它凭一己之力,在世界AI届掀起滔天巨浪。DeepSeek声称他们只用 2000 块Nvidia H800 GPU就构建了一个与Open AI的GPT o1相当的模型,训练成本仅为558万美元。相比之下,Open AI已经在基础设施和训练上花费了数十亿美元。掀起AI界的震荡
受此影响,英伟达股价暴跌 17%,市值蒸发逾 5000 亿美元,加里·马库斯 (Gary Marcus) 宣称“OpenAI 很可能成为人工智能领域的 WeWork”。WeWork是一家美国租赁办公空间的公司,这家曾经的明星公司在吸引了大量投资后在2023年底破产了。引起行业质疑
一些专家对这些训练成本提出质疑,称Deepseek可能隐藏了一些秘密,比如可能规避了美国芯片出口限制,甚至窃取Open AI的研究成果。Deepseek是否违规访问OpenAI接口,对其模型进行蒸馏。事实上,微软正在调查Deepseek是否不当使用了 Open AI的数据来加速自己的发展。AI界的原有法则:大资金投入才能取得领先
Deepseek让AI界对一个新贵能如此迅速地挑战美国巨头的可能性感到恐慌。微软仅在2024年最后一个季度就在AI基础设施上投入了800亿美元,Meta则投入了 650 亿美元。两家公司都表示计划在2025年继续大举投入,与此同时,据报道Open AI正寻求再筹集250至400亿美元,增加其估值到3000或3400亿美元。显然,这些公司认为需要大量资金才能保持在AI届的领先地位。但DeepSeeks的例子却能证明,不需要大量预算也能获得顶级表现,这从根本上动摇了这一假设。拥有更高的透明度和推理过程
当Business Insider测试DeepSeek的深度思考设置时,系统会输出一页又一页的推理过程,然后才能得出最终答案,这种透明度受到开源社区用户的喜爱。相比之下,Open AI 的模型(如 o1 和 o3)不会向你展示它们的中间推理过程。有趣的是,Sam Altman现在表示Open AI将开始让人们看到更详细的思考过程,并将这一改变归功于DeepSeeks R1。Sam Altman开始反思Open AI的开源策略
最近,Open AI首席执行官Sam Altman在Reddit上发表了一些令人惊讶的评论。他承认,Open AI在AI 开源方面可能站在了历史的错误一边。Open AI最初是作为一个非营利组织成立的,承诺公开分享研究成果。然而,多年来,他们变得更加封闭,尤其是在推出 ChatGPT 这样的产品时。正在考虑开源模型权重
Altman还表示,Open AI可能会做出改变的另一个领域是开源模型权重。目前,Meta和Deepseek等公司都公开了其 AI 背后的所有细节,让任何人都可以在其基础上进行构建。Open AI历来不愿意这样做,但Alman暗示内部正在进行讨论,尽管Open AI内部并非所有人都认同这个想法。他说这不是他们的首要任务,但肯定会考虑。