DeepSeek绕过Cuda
春节这几天,中美两国都是谈着DeepSeek,对英伟达的股价起落心情不一。
美国宏观经济数据不好,白宫不惜破坏市场信用,用粉饰劳工岗位数据的形式大造科技股“人工牛市”,核心支撑是英伟达的GPU芯片泡沫。
DeepSeek团队最新MoE(混合专家)模型仅使用2000颗英伟达H800芯片(美国出口管制版本,俗称“阉割版”),便达到GPT-4 Turbo 90%的基准性能。
相比之下,OpenAI训练GPT-4需要消耗约25000颗A100芯片。这意味着DeepSeek仅用1/12的算力成本就实现了接近的性能,这对英伟达的“算力护城河”构成了巨大冲击。
DeepSeek的可怕之处在于,它绕开了英伟达的Cuda平台。
黄仁勋的思路是不仅卡住芯片制造,也卡住计算平台Cuda。他对董事会宣扬的一直就是Cuda,不是芯片。
英伟达创造了当代高性能计算的所有标准软件、硬件以及工具生态。AI领域你唯一选择全产品线的就是英伟达,其他公司不能分割英伟达的部分。
这还是带有很强“PC到手机”领域的垄断思路。
有微软操作系统的影子,也有类似苹果乔帮主式样的霸权独裁,用户捏着鼻子只得接受你。
DeepSeek只有在中国才能实现,因为中国业界能拿到就只有阉割版。
必须通过无限度压榨底层操作系统来优化性能。于是有了DeepSeek团队的怪招数:
他们用比cuda更底层的ptx语言重写了cuda的硬件逻辑,让其中有20个流处理器硬件干了CUDA规定的以外的事,弥补了阉割版显卡在网络通信中的不足。
这相当于废了英伟达Cuda操作指令,自己来了套操作逻辑,直接给英伟达的硬件发号施令。



这套高效率的逻辑站稳脚跟了,随之而来人人都想得到的是,DeepSeek自己能搭载在英伟达硬件上,构建自己的一套生态系统。
护城河体系都被肢解了,英伟达还能讲什么故事呢?它不过就是AI模型时代的英特尔+华硕主板而已,挣你该挣的毛利得了。
还霸主呢?哄孩子吧。
1月27日是芯片板块黑色一日。
英伟达股价全天重挫16.86%,市值蒸发超过5900亿美元。其他芯片类和科技类个股也都暴跌,如博通下跌17.4%,AMD下跌6.37%。
亚马逊撤销百余GPU订单
DeepSeek论文不仅揭示了中美AI大模型领域差距在快速缩小,顺带也打击了英伟达的芯片性能销售体系,无意识之间踢爆了美股的AI算力泡沫。
囤积英伟达芯片的厂商一夜之间,手上的资产将变成负面资产,面临未来看淡,估值贬低的尴尬地步。
这个场景很像中国房地产企业囤积土地,却因为房产萧条而土地价值变低,企业一下子负债。
我们很容易推测这个局面:
中美两国关系敏感,金融恶战正酣,都盯着对方命根子在打——美债捅破中国房地产龙头万科盈利金身,而中国围魏救赵,全力攻击美国科技故事的顶梁柱英伟达。
DeepSeek的出现,犹如神来之笔,好比李云龙反突击坂田联队,绝地反击,打出了士气,打响了志气。
美国科技股七姐妹联盟也不是铁板一块。
英伟达受重压之下,各家巨头打着自己的小算盘。
马斯克代表特斯拉第一个质疑DeepSeek的蒸馏算法,从发言的时间来看,这位“中国人民的老朋友”,算是黄仁勋的铁杆盟友。
苹果、微软默不做声。
微软是英伟达Hooper芯片囤货量最大的主顾,有48.5万颗。
谷歌、Meta(Facebook母公司)都忙于做评估,暂时没有发表观点。
Meta囤货量排第二,22.4万颗;谷歌排第四,16.9万颗。
英伟达第三大客户、拥有19.6万颗芯片的亚马逊,则是以实际行动在英伟达最糟糕的时候捅了一刀。


它连夜修改了商业合同,据说撤销了超过100张英伟达GPU芯片的订单,涉及违约金超过2亿美元。
宁可赔钱,也不要跌价的芯片了。可能未来不会缺货,芯片也不那么值钱。这是亚马逊的看法。
英伟达仓促之下,也没能力推翻DeepSeek的论点。
官方承认DeepSeek的技术突破,确实冲击了市场对GPU需求增长的预期。然而,英伟达也强调,AI推理需求将呈指数级爆发,未来仍需要大量英伟达芯片来支持服务落地。
英伟达援引高盛预测数据称,到2027年AI推理芯片市场规模将达2400亿美元,是训练市场的3倍。
此外,英伟达还披露了下一代B100芯片的推理能效将比H100提升35倍。
但DeepSeek太过光彩耀目,英伟达的反击苍白无力,不足以扭转大势——AI计算芯片存在巨大泡沫。
算力市场泡沫太大,吸引力又太强,其利益大到护城河都保不住利益果实。
人人都希望英伟达倒掉。它倒了对谁都好。
这倒是很真实的想法。
华为昇腾芯片意外收益
DeepSeek的这套打法可以压榨硬件性能,其他公司的弱芯片也能搭载,或许也能和英伟达的系统打得有来有回呢。
全球AI基础设施生态正快速重塑。
就因为DeepSeek论文提及一句话“部分模块可无缝迁移至昇腾平台”,华为昇腾910B芯片单日订单激增300%。
美国对中国的人工智能芯片出口管制,促使国内企业和机构寻求国产芯片替代方案。结果又是华为,旗下昇腾芯片获得了难得的历史机遇。
昇腾910B芯片在性能上与英伟达的A100基本对标,甚至在某些指标上略有超过,目前是“够用”的阶段。
华为昇腾整个体系是健全的。除了硬件架构完整外,还构建了全栈AI软硬件平台,包括CANN计算架构,对标英伟达CUDA核心软件层。


华为销售架构和服务支撑都比英伟达在国内要完善很多,国家层面也在倾斜性支持。
中国移动采购6000台AI服务器,就是昇腾芯片独家竞标。
各地政府正在建设智算中心、超算中心,例如苏州环太湖领域、武汉东湖地区、西南省份的算力中心,昇腾芯片在政府竞标中都成为首选。
此外,央国企也在加速信创,推动昇腾芯片在金融等行业的应用。
阿里、腾讯、字节跳动、百度等互联网巨头也在大量采购昇腾芯片。
当年志愿军抗美援朝,毛主席说“打得一拳开,免得百拳来”,上甘岭战役打得很艰苦,付出重大代价取得了胜利。
朝鲜战场后期,中国军工体系适应了战争发展,炮弹和防空体系都建立起来,李奇微惊呼“中国人变得会打仗了,能跟我们一样发射炮弹”。
今时今日,DeepSeek杀出一条血路,何尝不是科技战线的“上甘岭战役”?扛住了美国的极限施压,中国产业迅猛成长,越战越勇。
什么样的人能做到从0~1的创新?就是灵魂自由的人,跟土壤或社会制度都没关系。
至少你在对手面前先站起来,至少先敢于打破“美国科技无敌”的迷信,至少敌人强加于你的时候,敢于面对,敢于斗争。
你知道为什么这帮小孩能做得出来吗?为什么他们就能从工程创新的角度来想事情呢?就是因为没有美国人的硬件条件。
新一代中国人的灵魂是自由的,所以他才敢于做反抗。他的底层精神暗示是立场,是斗争。
当年的“小米加步枪”,如今横空出世的DeepSeek。
时机和趋势是在我们这边。
连动画片都在暗讽美国失势,润人被练成丹。
美国什么时候这么落魄过?板门店谈判桌上都不曾有过。