Deepseek登顶,冲击全球算力股,美国AI界从想赢到怕输

王新喜科技趋势 2025-01-27 22:24:35

文/王新喜

近这几天,国产AI大模型DeepSeek R1,一飞冲天,在全球AI圈持续引爆热度,DeepSeek R1 已经是世界上最先进的 AI 模型之一,可与 OpenAI 的新 o1 和 Meta 的 Llama AI 模型相媲美。

DeepSeek-V3模型发布后,在美国热度持续飙升。美国媒体发布紧急信息,中国的新ai技术,已威胁到美国的领先地位。

在接受 CNBC 的最新采访时,Scale AI 创始人兼首席执行官 Alexander Wang 表示,DeepSeek R1 在其公司最具挑战性的 AI 测试中达到或击败了所有表现最佳的 AI 模型。在众多第三方测试中,DeepSeek-R1同样超越了OpenAI的最新模型o1。

英国知名学术期刊《自然》也指出,DeepSeek-V3在化学、数学和写代码方面的表现已经追上了目前美国最强的人工智能公司OpenAI相当先进的o1模型。

就在昨天早上,DeepSeek还没有挤进榜单前五,截至北京时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT,而排在第三的则是Meta旗下的Threads。

这说明两个这个爆火程度不亚于当时OpenAI推出的ChatGPT,毕竟现在都在堆叠参数量、显卡量的时候,能走出另一条路也算是窥探出来AI大模型领域的其他研究领域分支的出现。

DeepSeek冲击全球算力股,美国AI界从想赢到怕输

一个值得关注的现象是,DeepSeek 火爆开始冲击全球算力股,最受关注的是,deepseek凭一己之力把英伟达带崩了,美股盘前英伟达夜盘跌超7%,市值蒸发接近两万亿人民币,美股纳指期货暴跌2.3%。

上周,日本半导体股和受益于特朗普“星际之门”项目所带动的市场乐观情绪,表现尤为突出。然而周末,在DeepSeek的冲击下,日本半导体股下挫,软银集团股价一度下跌5.4%,创下11月1日以来的最大跌幅;东京电子和Disco均跌超3%;英伟达的测试设备供应商爱德万测试跌8.2%。

英伟达等算力股下跌的逻辑并不复杂,本质是被DeepSeek降维打击了不断的堆算力堆GPU的AI发展模式,在美国禁先进AI算力的情况下,中国可以采用英伟达20%的算力卡来与美国竞争。

它的训练成本极低。它只用了1024张英伟达H800显卡,花费只有560万美元,不到OpenAI GPT-4o模型训练成本的十分之一。作为类比,OpenAI的ChatGPT-o1使用了至少一万张更为先进的英伟达H100显卡,其成本大约为1亿美元。

尽管DeepSeek现在尚未公布训练推理模型R1的完整成本,但它公布了API的定价,每百万输入 tokens 1 元-4元人民币,每百万输出 tokens 16 元。这个收费大约是 OpenAI o1运行成本的三十分之一。

现在美国AI业界心态上已经非常不自信了,在外媒看来, DeepSeek 就像神秘的东方魔法,将模型训练成本降到了不可思议的程度。国外大拿Gary Macus 直接说「AI 霸权之争已经结束」,担忧情绪笼罩美国。

因为DeepSeek证明,不再需要最先进的芯片来训练大模型,“DeepSeek-V3模型是在英伟达H800上训练的,这是英伟达为中国客户定制的速度较慢的GPU。然而,AMD的MI 300X GPU在关键基准测试中表现优于H100。美国私募认为,GPU市场格局或被改写!甚至DeepSeek可能会颠覆英伟达在AI硬件领域的主导地位。因为DeepSeek-V3模型的突破显著降低了AI培训成本,使AMD GPU成为比英伟达更具有成本效益的替代品。

国外分析师Holger Zschaepitz也有类似观点:“中国的DeepSeek可能代表了对美国股市最大的威胁,因为该公司似乎以极低的价格建立了一个突破性的人工智能模型,而无需依赖最先进的芯片,这引发了对数百亿美元资本支出是否有用的质疑,这些资金正被投入到这个行业中。 ”

慌的不仅是英伟达,美国ChatGPT的创始人山姆·奥特曼突然宣布,将ChatGPT O3Mini版本从原先的每月200美元收费,直接改为完全免费!这一举动无疑透露出深深的怕输与担忧情绪。

在这种形势下,现在越来越多的美国用户正在担心美国会不会禁止使用DeepSeek,毕竟数据都需要保存在中国。

这也事关OpenAI和 Meta 的 Llama AI等大模型的生存与未来。扎克伯克已经彻底慌了。

不过,尽管DeepSeek大幅降低的成本,但毕竟还是依赖英伟达的AI芯片。在此之前,旷视、依图、云从、摩尔线程等大量 AI 公司被列入美国“实体清单”,对于一些 AI 软件公司来说有一定影响——无法再训练出万亿规模大模型。据 DeepSeek 首席执行官称,中国人工智能实验室 DeepSeek 可以使用数万个 NVIDIA H100 AI GPU 进行训练。

而美国Scale AI的亚历山大·王认为,DeepSeek的芯片数量可能远远高于外界想象。他公开表示,自己认为DeepSeek至少拥有5万块H100,他们不会公布具体数字。他指出,未来中国AI行业可能会面临更多挑战,“未来他们将受到我们已经实施的芯片和出口管制的限制,难以再获取更多芯片。”

美国很限制芯片,其实结果或也没有什么不同,中国AI芯片公司的产品很多已经不弱于英伟达H800,使用中国AI芯片的中国大模型,完全可以不逊色美国顶尖大模型。

美国AI界为何开始怕输了?

这是一场开放与封闭的战役,中国DeepSeek的模型是开源的,他们将制造这些东西的知识免费提供给全世界,确保没有人能够真正垄断它。

而美国公司则是封闭的。OpenAI、Anthropic或谷歌没有开源任何强大的模型。在价格与性能层面颠覆之后,现在DeepSeek需要打造一个生态系统,而其自身所拥有的开源、共享、低价与颠覆性的性能与模式,正是这个生态系统完成的必要条件。

DeepSeek 采用开源方法,汇集集体专业知识并促进协作创新。这种方法不仅可以缓解资源限制,还可以加速尖端技术的开发,真正做成一个全球化的大模型。

DeepSeek 以极低的成本,极强的性能,再加上人人可用的开放态度,征服了国外的研究人员和开发者。现在网络上已经出现了一波复现热潮,加州大学伯克利分校、香港科技大学、知名人工智能公司HuggingFace等纷纷成功复现,复现成本甚至低至几十美元。英伟达的“老对手”AMD还火速亲自为DeepSeek“站台”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。

未来的趋势来看,全世界的工程师都可能会从qwen和ds开始学习大模型。如果按照这个趋势发展,我们或许可以看到互联网产业第一次由中国公司掌握基建标准的案例。

美国要与DeepSeek竞争,面临越来越绝望的局面,虽然Facebook表示DeepSeek与美国顶级的大模型仅有一分之差,但事实上,他们清楚的知道,DeepSeek实际上已经赢了美国的顶尖模型,在性能差不多的情况下,成本差距已经拉开太大,而且还是开源模型,等于把其他所有模型的商业化道路堵死了,就像中国互联网公司的烧钱大战,用1块钱能烧出你30块甚至50块的效果,你再有钱也耗不起。

从这个角度来看,DeepSeek代表了更先进的技术与模式,降本增效是颠覆式创新产生的前提,更让美国AI界担忧的是,中国能做出大模型的公司太多了,大家互相学习追赶,现在又把算力瓶颈突破了,接下来就是拼软件应用与服务场景、成本价格,中国的成本优势与规模效应带来的冲击效应或还在后头,我们拭目以待。

作者:王新喜 TMT资深评论人 本文未经许可谢绝转载

0 阅读:0
王新喜科技趋势

王新喜科技趋势

感谢大家的关注