美国人慌了!DeepSeek再现“斯普特尼克时刻”,AI霸权或将易主?

围炉话今朝 2025-02-05 09:46:42

最近,DeepSeek实在是太火了,火到什么程度呢?

美国一场山林大火在数周内烧掉加州2500亿美元,而DeepSeek的横空出世,竟让纳斯达克瞬间大跌3%,市值蒸发五千多亿。

这一数据换算成百元美钞,需87架满载的空客380运往焚烧厂,足见其引发的市场震动。

这不禁让人发问:美国人为何对DeepSeek如此惧怕?它究竟有何独特之处?是否被高估?又为何会陷入“偷学”的争议漩涡?

美国人对DeepSeek的恐惧,根源在于他们心中那根“斯普特尼克时刻”的刺。

1957年10月,苏联成功发射人类历史上第一颗人造卫星——斯普特尼克号。这一消息让美国民众震惊不已,对他们而言,就如同连续多年的年级第一,却突然发现被顶尖学府提前录取的并非自己。

斯普特尼克号

这种心理上的冲击,促使美国成立了NASA,并倾举国之力完成了登月壮举,才稍解心头之痛。如今,DeepSeek的出现,再次触动了他们敏感的神经,让美国人仿佛又看到了另一个“斯普特尼克时刻”。

DeepSeek堪称大模型界的“拼多多”。

它的推理能力与OpenAI的ChatGPT不相上下,却有着许多优势。无需翻墙,无需美国信用卡,更不用担心因身份被歧视性封号,这对广大用户来说极具吸引力。

但最令人瞩目的,当属其低廉的成本。

据悉,ChatGPT完成一次训练的成本高达上亿美金,而DeepSeek仅需不到600万美金,仅为前者的二十分之一。

这一巨大的成本差异,就像一台原本售价20万的新能源车,突然以1万的价格出售,着实令人难以置信。美国科技界对DeepSeek进行评测后,被其与ChatGPT相近的推理能力所震惊,这一结果直接导致英伟达股票大跌17%。因为DeepSeek做到了硅谷科技巨头们未能做到的事——在训练模型时大幅降低对GPU的依赖。

英伟达股票大跌近17%

那么,DeepSeek是如何做到这一点的呢?这背后离不开美国的“小院高墙”策略。

2018年,美国针对中国提出“小院高墙”的科技防御策略,在半导体、量子信息技术、人工智能等关乎国家安全的关键领域设置壁垒,采取出口管制、限制牵连和审查投资等手段。

2022年,美国禁止英伟达向中国出口高端GPU,而这些GPU对于训练AI大模型至关重要。美国此举,就如同“年级第一”害怕被超越,不再愿意与“第二名”分享资源。

面对这一困境,中国科研人员另辟蹊径。

其中,混合专家系统(MOE)发挥了关键作用。以医院为例,如果每个医生都是全能的全科医生,虽然能解决所有病症,但培养成本极高。

而MOE就像将医院分成不同科室,每个科室的医生专注于特定领域,用多个专科医生替代昂贵的全科医生,并设置导诊台分配患者,这样不仅降低了训练成本,还提高了效率。在AI训练中,这种方式减少了对单一复杂模型的依赖,降低了对GPU的需求。

同时,强化学习(RL)也为降低训练成本做出了贡献。孩子学习走路并非依靠标记正确与错误姿势的照片,而是在不断尝试中,根据摔倒的疼痛或走好的鼓励来调整姿势,最终学会走路。

强化学习就是借鉴这种方式,通过激励函数而非人工打标签的数据让AI进行学习,从而大幅降低了训练成本。正是MOE与RL的结合,让DeepSeek在资源受限的情况下实现突破,而美国由于GPU资源充足,缺乏这种创新的动力。

DeepSeek的出现虽短期内让英伟达股票受挫,但从长远来看,无需过度担忧。

1776年,瓦特改良蒸汽机,原本预期会大幅减少煤炭消耗,但实际情况却恰恰相反。蒸汽机效率提升后,更多人能够使用煤炭,工厂数量激增,最终煤炭消耗量上升了100倍,这就是著名的杰文斯悖论。

DeepSeek与英伟达显卡的关系亦是如此,它提升了显卡使用效率,短期内可能减少显卡需求,但随着更多人因训练成本降低而加入模型训练,显卡需求将迎来反弹式增长。

事实也证明,第二天英伟达股票便上涨了8%。

然而,在DeepSeek的热度背后,质疑声也接踵而至。

美国白宫顾问David Sacks公开表示,有实质性证据证明DeepSeek“蒸馏”了OpenAI模型的知识,并将其类比为盗窃行为。

所谓“蒸馏”,在AI领域指的是学生模型通过向老师模型提问并记录答案,以此训练自身,从而获得与老师模型相近的能力。

但这种指控缺乏确凿依据,就如同不能以三天学会的知识去否定三十年的研究成果。况且,ChatGPT用户协议虽禁止使用其模型训练竞争模型,但并无证据表明DeepSeek违反此规定。

若DeepSeek确实被无端污蔑,完全可以通过法律途径维护自身权益。

尽管DeepSeek的成功令人振奋,但我们必须清醒地认识到,它虽然缩小了与美国AI的差距,但尚未实现全面超越。AI作为一项具有变革性的技术,对国家发展至关重要。

美国将抢先实现通用人工智能的计划称为“曼哈顿计划2.0”,并对中国AI采取封锁策略,对于这一现象,DeepSeek和ChatGPT给出了不同的回答。

DeepSeek认为技术竞合能催生共赢,封锁不利于创新;

DeepSeek

ChatGPT虽也不认同封锁,但表示美国可能出于竞争与安全考量,选择部分领域进行封锁。

ChatGPT

DeepSeek的出现,不仅展示了中国在技术受限情况下的创新能力,也引发了全球对AI发展与竞争的深入思考。

未来,AI领域的竞争与合作将走向何方,无疑值得我们密切关注。

文本内容源自@刘润的视频内容

0 阅读:0
围炉话今朝

围炉话今朝

感谢大家的关注