文/王新喜
Deepseek曾一夜把英伟达与Open AI拉下神坛,但如今的冲击效应仍在持续。美国依然不死心,认为DeepSeek不可能通过优化搞出如此低成本的AI大模型,认为有其他走私英伟达高性能芯片渠道没有堵住。
新加坡《联合早报》早前发文称,美国政府正在调查中国DeepSeek,判断其是否从新加坡获得了被美国明令禁止对华出口的芯片。新加坡坚称自己遵守美国的禁令。
而在2月27日,据广播公司亚洲新闻频道(Channel News Asia)报道,新加坡警方和海关当局在26日已指控三名男子涉嫌绕过美国贸易出口限制,将英伟达GPU非法再出口给中国人工智能公司DeepSeek。

但新加坡贸易和工业部第二部长 Tan See Land 发布声明称:“英伟达向新加坡销售的产品的实物交付仅占英伟达总收入的不到 1%。全球实体的常见做法是将采购商品和服务的计费集中在其中心,但这与产品最终运送到的地方是分开的,因为远离我们的检查。”
也就是说,尽管海外媒体将事件与DeepSeek关联,但新加坡警方未明确证实芯片最终流向该公司。英文报道仅提及案件与非法转运相关,而中文报道的“9人被捕”细节存在信息差异,部分媒体被指夸大或误导。
而新加坡也否认DeepSeek通过新加坡获取受管制芯片。英伟达也澄清其新加坡营收主要反映客户账单地址,而非实际运输终点。
事实上,周末DeepSeek扔出的王炸——首次披露了成本利润率等关键数据,其实就是打脸了美国在新加坡的芯片走私调查。

DeepSeek用226台H800服务器,日赚409万,而成本是63万元。理论上每日净赚约346万元,成本利润率高达545%。当然,实际收入没这么多,因为只有部分服务实现了商业化,但这个已经足够震撼!基本免费的DeepSeek就开始赚钱了,而世界最贵的OpenAI却在巨额亏损。
正如有网友说:“我上一次见这么吓人的利润率还是在禁毒宣传里。”
而DeepSeek公布模型推理成本,采用的是大规模跨节点专家并行,计算通信重叠、GPU 分配均衡的计算负载、通信负载,实现H800 GPU集群545%的成本利润率。具体来看,DeepSeek用的是英伟达的H800 GPU,白天业务忙的时候,就把所有节点都用来做推理服务;晚上业务少了,就减少推理节点,把这些节点拿去做研究和训练。

Deepseek R1 刚火的时候,英伟达这边说可以达到 3800 tokens 每秒(用的还是H200),而DeepSeek自己优化到了了1.4 万 Token 。
H200是H100升级全新型号,而H800是H100的阉割型号(H100不让买,H800是之前中国特供阉割型号)。举个例子,他们用5090干的活,还不如4090D的四分之一。
中国工程院院士王坚近期也就这个问题谈了自己的观点,为啥《Nature》杂志要为DeepSeek连发5篇文章,因为它想到的是,这个东西你能不能推动科技的发展。就科学而言,AI不是工具的革命,是科学革命的工具。

这次梁文锋把开源大业进一步推进,将v3和R1模型的推理成本,和如何实现低成本推理过程彻底公之于众。如果之前五天开源,很多infra公司质疑最后部署成本的话,那现在就是直接告诉你,多少机器部署,最近数据是多少,开源有多少利益,把怎么部署的方法都开源了,让部署了R1的厂商们有了优化的思路,从而进一步降低大家使用AI的成本。
这一下子打了刚刚发布最贵大模型ChatGPT4.5的OpenAI的脸。对比美国,OpenAI的模型收费一直挺贵的,刚发布的GPT-4.5,API调用价格高得离谱,每100万tokens输入就要75美元,和DeepSeek的正常价格比起来,贵了280倍。
这背后透露了什么信号?就是当算法优化突破临界点,算力基础设施即可从"资源消耗型"跃迁为"价值创造型"。也就是说,从智算基础设施到智算服务是能赚钱的,Open AI与英伟达的股价与市场预期真的回不去了。

这意味着,英伟达的卡是好,但非必须,不需要什么万卡集群。
DeepSeek一开始用了英伟达的,但很少,低成本,这个好多机构复现证实了。 第二,deepSeek后续改用华为等国产硬件,跟英伟达切割了。这个双方也发公告证实了。

这周末还有个消息就是,老美可能禁售所有AI芯片,在业内没有引发太大关注,因为大家知道,h20这种阉割再阉割的产品禁售,已没有意义了,按照DeepSeek对算力的低性能与成本需求,国产GPU已足够了。如果美全面禁止,我们的AI硬件算力、应用、机器人赛道会发展的更快。
我们的成本更低,把钱用在钢刃,可以甩开膀子大力干AI应用,因为很多中小企业会因为DeepSeek长期受益。
加上又是开源,全球大量企业都会因为DeepSeek的低成本而接入。目前多个欧洲初创企业已开始从OpenAI的ChatGPT转向此平台,欧洲一大批转用DeepSeek的公司已赚麻。
毕竟,现在美国都已经在全球薅羊毛,特朗普也在为赚钱辛苦奔波,在全球经济不景气的当下,降本增效几乎是所有企业的痛点,成本问题是所有搞AI的公司要面对的大问题。

目前20家全球科技巨头宣布已与DeepSeek整合,包括NVIDIA、AMD、微软、亚马逊网络服务(AWS)、英特尔等国际巨头,以及MetaX、Iluvatar CoreX、海光信息等中国GPU企业。
而DeepSeek带来的算力成本降低,有机会让所有芯片都具有适配大模型能力。华为昇腾、沐曦、天数智芯、摩尔线程、海光、壁仞科技、燧原科技、昆仑芯等算力芯片厂商,相继宣布适配DeepSeek模型服务,尤其是华为AI芯片已在智驾上被验证,汽车AI就超过英伟达,另一个应用最大的医疗AI华为的瑞金系统也成型了。
存储厂商方面,多家为 DeepSeek 提供 SSD、HDD、HBM 等存储设备,共同开发定制化存储解决方案。整个产业链都跑起来了。

而打破算力牢笼,中国的第二把尖刀是LPU。 中国工程师已瞄准这场算力战场的"诺曼底"!我国自主研发的LPU芯片即将强势登场。我国清华系公司无问苍穹推出的无穹LPU,将算力成本减少了90%以上。这一数据对英伟达等GPU的冲击可能在后头。

而沙特也已为美国的 LPU 制造商 Groq注入了15亿美元的资金,助力其在 LPU 技术的研发和规模扩展。
种种迹象,无疑对英伟达的增长预期造成暴击。
经过春节前后的那一波冲击之后,2月27日,英伟达股价再度重挫8.48%,一夜蒸发近2万亿元。英伟达告别了巅峰期,今后的日子,可能就是下坡路了。

随着开源的进展在全球市场推进,未来某天,DeepSeek或有这个潜力替代ChatGPT。
从种种迹象来看,DeepSeek将推动中国全方位AI升级,美国的AI芯片禁售将加速这一进程发展,正如有院士直言,现在最怕的不是技术封锁,而是美国突然全面技术开放。但老美不到黄河不死心,中国国运要来挡都挡不住。
有报告称,2030年中国人工智能发展将超越美国,我们拭目以待这一天的到来。