DeepSeek，AI界的黑天鹅 - 资讯(世良情感网)

“DeepSeek，AI界的黑天鹅”

5000亿美元的星际之门

唐纳德·特朗普宣布了星际之门计划。目前的投资者包括OpenAI、软银、甲骨文和总部位于阿布扎比的投资基金MGX。初始投资为1000亿美元，到2029年预计将达到5000亿美元。

DeepSeek横空出世

仅两天后，我国AI初创公司Deepseek发布了开源AI模型R-1，这是一个类似于GPT-4o的推理模型，随后又发布了一个名为Janus Pro的图像生成模型。两者都不是同类中绝对最好的，但都名列前茅。他们最具颠覆性的是其开发成本。

训练成本打破认知

在今年1月之前，几乎没有人听说过Deepseek，但它凭一己之力，在世界AI届掀起滔天巨浪。DeepSeek声称他们只用 2000 块Nvidia H800 GPU就构建了一个与Open AI的GPT o1相当的模型，训练成本仅为558万美元。相比之下，Open AI已经在基础设施和训练上花费了数十亿美元。

掀起AI界的震荡

受此影响，英伟达股价暴跌 17%，市值蒸发逾 5000 亿美元，加里·马库斯 (Gary Marcus) 宣称“OpenAI 很可能成为人工智能领域的 WeWork”。WeWork是一家美国租赁办公空间的公司，这家曾经的明星公司在吸引了大量投资后在2023年底破产了。

引起行业质疑

一些专家对这些训练成本提出质疑，称Deepseek可能隐藏了一些秘密，比如可能规避了美国芯片出口限制，甚至窃取Open AI的研究成果。Deepseek是否违规访问OpenAI接口，对其模型进行蒸馏。事实上，微软正在调查Deepseek是否不当使用了 Open AI的数据来加速自己的发展。

AI界的原有法则：大资金投入才能取得领先

Deepseek让AI界对一个新贵能如此迅速地挑战美国巨头的可能性感到恐慌。微软仅在2024年最后一个季度就在AI基础设施上投入了800亿美元，Meta则投入了 650 亿美元。两家公司都表示计划在2025年继续大举投入，与此同时，据报道Open AI正寻求再筹集250至400亿美元，增加其估值到3000或3400亿美元。显然，这些公司认为需要大量资金才能保持在AI届的领先地位。但DeepSeeks的例子却能证明，不需要大量预算也能获得顶级表现，这从根本上动摇了这一假设。

拥有更高的透明度和推理过程

当Business Insider测试DeepSeek的深度思考设置时，系统会输出一页又一页的推理过程，然后才能得出最终答案，这种透明度受到开源社区用户的喜爱。相比之下，Open AI 的模型（如 o1 和 o3）不会向你展示它们的中间推理过程。有趣的是，Sam Altman现在表示Open AI将开始让人们看到更详细的思考过程，并将这一改变归功于DeepSeeks R1。

Sam Altman开始反思Open AI的开源策略

最近，Open AI首席执行官Sam Altman在Reddit上发表了一些令人惊讶的评论。他承认，Open AI在AI 开源方面可能站在了历史的错误一边。Open AI最初是作为一个非营利组织成立的，承诺公开分享研究成果。然而，多年来，他们变得更加封闭，尤其是在推出 ChatGPT 这样的产品时。

正在考虑开源模型权重

Altman还表示，Open AI可能会做出改变的另一个领域是开源模型权重。目前，Meta和Deepseek等公司都公开了其 AI 背后的所有细节，让任何人都可以在其基础上进行构建。Open AI历来不愿意这样做，但Alman暗示内部正在进行讨论，尽管Open AI内部并非所有人都认同这个想法。他说这不是他们的首要任务，但肯定会考虑。