deepseek接连掀翻英伟达和openAI的饭桌

阿索的杂谈小论 2025-01-29 11:01:02

深度求索(DeepSeek)这家公司真会挑时间发布新闻,这几天整个AI圈闹得沸沸扬扬。这一国产公司可谓是把整个AI市场搅动起来了。

如图所示,我就很开心,又有一国产公司登上了世界舞台,那两个收高额服务费的行业头头得瑟不了多久的。deepseek对世界AI市场的冲击只会越来越厉害!

老外也很精明,不傻,有好东西上线,他们搞研究的直接抛弃了此前使用的“高贵”模型,纷纷选择了DeepSeek旗下产品。

毕竟DeepSeek跟之前的ai模型相比,长文本处理、代码生成和数学能力等方面都很顶,甚至在AIME2024和CNMO2024等相关测试中,刷新了AI数学能力记录。

最亮眼的是训练DeepSeek的成本是美西方模型的几十分之一,用了仅仅不到558万美元。这里有点意思的就是,这训练成本比Meta生成式AI部门里每位领导的薪资还低......

DeepSeek无疑是一匹震惊科技界的黑马。

OpenAI早期成员、特斯拉前AI总监安德烈·卡帕西对DeepSeek的训练效率和成本控制表示惊叹。他指出,DeepSeek仅用2048颗GPU和几百万美元的成本就完成了训练,而类似规模的模型通常需要数万颗GPU和数亿美元的成本。他认为这是资源优化和工程能力的典范。

Meta老板,著名“蜥蜴人”扎克伯格说道,DeepSeek是一个很有竞争力的对手,这让他意识到中国在AI上与美国的差距微乎其微,可以说贴身在背后跨半步就要超了。他不慌是假的,至少他家的员工很慌。

1月23日,在美国匿名职场论坛TeamBlind 上,一名Meta公司员工发布帖子称 “Meta生成式人工智能部门陷入恐慌”,主管和工程师成立了四个 “战情室” 研究 DeepSeek模型的运作方式。

Scale AI创始人亚历山大·王(华裔)在2025年达沃斯世界经济论坛上表示,DeepSeek的AI大模型性能大致与美国最好的模型相当,并暗示DeepSeek可能会受到美国的芯片调查和管制。

他提到:“DeepSeek大约有5万张H100计算卡,他们显然不能谈论这件事,因为这违反了美国实施的出口管制。我认为这是真的,我认为他们的筹码比其他人预期的要多,但也会继续前进。他们将受到芯片控制和出口管制的限制。”

试问老美的玻璃心有多脆弱,DeepSeek再扎一刀。

AI市场竞争的本质就是人才。DeepSeek创始人梁文锋,小镇做题家,没有国外留学。员工大多应届毕业生,部分博士实习生。放在国际AI市场可以说是毫不起眼,但却偏偏做了一个可以改变AI市场的伟大产品。

梁文峰之前在面对媒体采访时说了那么一句话:“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人!”

这一刻老美的制裁就是个笑话

1 阅读:254
阿索的杂谈小论

阿索的杂谈小论

茶余饭后,偷得浮生半日闲