近一周,中国深度求索公司的一款大模型在全球范围内引起了广泛关注,特别是让美国硅谷感到震撼和恐慌。该模型在性能上与OpenAI的o1相当甚至超越,并以较低的成本实现了这一突破。
一篇匿名平台teamblind上发布的文章迅速传播开来,其中一位自称Meta员工的用户表示公司内部因DeepSeek模型进入恐慌模式。DeepSeek-V3在基准测试中已经超越了Meta推出的Llama4,更令人尴尬的是,这家只花费550万美元训练预算的中国公司竟能做到这一点。
据TheInformation爆料,MetaAI小组和基础设施团队的经理和工程师已开设了四个作战室来学习DeepSeek的工作原理。两个动员起来的小组正在试图了解如何降低训练和运行DeepSeek的成本。第三个Meta研究小组正在调查High-Flyer可能使用哪些数据进行训练其模型。第四个作战室则在考虑基于DeepSeek模型属性重构Meta模型的新技术。
AI科技初创公司ScaleAI创始人亚历山大·王在接受电视媒体公开采访时表示,中国人工智能公司DeepSeek的大模型性能与美国最好的模型相当。过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的大模型发布可能会“改变一切”。
Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI差距非常小。他还表示,中国正在全力冲刺,在将来有一个开源模型能被全世界广泛使用时,希望它是一个美国模型。