最近,DeepSeek实在是太火了,火到什么程度呢?
美国一场山林大火在数周内烧掉加州2500亿美元,而DeepSeek的横空出世,竟让纳斯达克瞬间大跌3%,市值蒸发五千多亿。
这一数据换算成百元美钞,需87架满载的空客380运往焚烧厂,足见其引发的市场震动。
这不禁让人发问:美国人为何对DeepSeek如此惧怕?它究竟有何独特之处?是否被高估?又为何会陷入“偷学”的争议漩涡?
美国人对DeepSeek的恐惧,根源在于他们心中那根“斯普特尼克时刻”的刺。
1957年10月,苏联成功发射人类历史上第一颗人造卫星——斯普特尼克号。这一消息让美国民众震惊不已,对他们而言,就如同连续多年的年级第一,却突然发现被顶尖学府提前录取的并非自己。
斯普特尼克号
这种心理上的冲击,促使美国成立了NASA,并倾举国之力完成了登月壮举,才稍解心头之痛。如今,DeepSeek的出现,再次触动了他们敏感的神经,让美国人仿佛又看到了另一个“斯普特尼克时刻”。
DeepSeek堪称大模型界的“拼多多”。
它的推理能力与OpenAI的ChatGPT不相上下,却有着许多优势。无需翻墙,无需美国信用卡,更不用担心因身份被歧视性封号,这对广大用户来说极具吸引力。
但最令人瞩目的,当属其低廉的成本。
据悉,ChatGPT完成一次训练的成本高达上亿美金,而DeepSeek仅需不到600万美金,仅为前者的二十分之一。
这一巨大的成本差异,就像一台原本售价20万的新能源车,突然以1万的价格出售,着实令人难以置信。美国科技界对DeepSeek进行评测后,被其与ChatGPT相近的推理能力所震惊,这一结果直接导致英伟达股票大跌17%。因为DeepSeek做到了硅谷科技巨头们未能做到的事——在训练模型时大幅降低对GPU的依赖。
英伟达股票大跌近17%
那么,DeepSeek是如何做到这一点的呢?这背后离不开美国的“小院高墙”策略。
2018年,美国针对中国提出“小院高墙”的科技防御策略,在半导体、量子信息技术、人工智能等关乎国家安全的关键领域设置壁垒,采取出口管制、限制牵连和审查投资等手段。
2022年,美国禁止英伟达向中国出口高端GPU,而这些GPU对于训练AI大模型至关重要。美国此举,就如同“年级第一”害怕被超越,不再愿意与“第二名”分享资源。
面对这一困境,中国科研人员另辟蹊径。
其中,混合专家系统(MOE)发挥了关键作用。以医院为例,如果每个医生都是全能的全科医生,虽然能解决所有病症,但培养成本极高。
而MOE就像将医院分成不同科室,每个科室的医生专注于特定领域,用多个专科医生替代昂贵的全科医生,并设置导诊台分配患者,这样不仅降低了训练成本,还提高了效率。在AI训练中,这种方式减少了对单一复杂模型的依赖,降低了对GPU的需求。
同时,强化学习(RL)也为降低训练成本做出了贡献。孩子学习走路并非依靠标记正确与错误姿势的照片,而是在不断尝试中,根据摔倒的疼痛或走好的鼓励来调整姿势,最终学会走路。
强化学习就是借鉴这种方式,通过激励函数而非人工打标签的数据让AI进行学习,从而大幅降低了训练成本。正是MOE与RL的结合,让DeepSeek在资源受限的情况下实现突破,而美国由于GPU资源充足,缺乏这种创新的动力。
DeepSeek的出现虽短期内让英伟达股票受挫,但从长远来看,无需过度担忧。
1776年,瓦特改良蒸汽机,原本预期会大幅减少煤炭消耗,但实际情况却恰恰相反。蒸汽机效率提升后,更多人能够使用煤炭,工厂数量激增,最终煤炭消耗量上升了100倍,这就是著名的杰文斯悖论。
DeepSeek与英伟达显卡的关系亦是如此,它提升了显卡使用效率,短期内可能减少显卡需求,但随着更多人因训练成本降低而加入模型训练,显卡需求将迎来反弹式增长。
事实也证明,第二天英伟达股票便上涨了8%。
然而,在DeepSeek的热度背后,质疑声也接踵而至。
美国白宫顾问David Sacks公开表示,有实质性证据证明DeepSeek“蒸馏”了OpenAI模型的知识,并将其类比为盗窃行为。
所谓“蒸馏”,在AI领域指的是学生模型通过向老师模型提问并记录答案,以此训练自身,从而获得与老师模型相近的能力。
但这种指控缺乏确凿依据,就如同不能以三天学会的知识去否定三十年的研究成果。况且,ChatGPT用户协议虽禁止使用其模型训练竞争模型,但并无证据表明DeepSeek违反此规定。
若DeepSeek确实被无端污蔑,完全可以通过法律途径维护自身权益。
尽管DeepSeek的成功令人振奋,但我们必须清醒地认识到,它虽然缩小了与美国AI的差距,但尚未实现全面超越。AI作为一项具有变革性的技术,对国家发展至关重要。
美国将抢先实现通用人工智能的计划称为“曼哈顿计划2.0”,并对中国AI采取封锁策略,对于这一现象,DeepSeek和ChatGPT给出了不同的回答。
DeepSeek认为技术竞合能催生共赢,封锁不利于创新;
DeepSeek
ChatGPT虽也不认同封锁,但表示美国可能出于竞争与安全考量,选择部分领域进行封锁。
ChatGPT
DeepSeek的出现,不仅展示了中国在技术受限情况下的创新能力,也引发了全球对AI发展与竞争的深入思考。
未来,AI领域的竞争与合作将走向何方,无疑值得我们密切关注。
文本内容源自@刘润的视频内容