当DeepSeek横空出世时,华尔街虽有些恐慌,但很快便镇定下来,因为英伟达的GPU仍然是不可逾越的护城河,只不过需求稍稍变小了一些。
但他们却不料,中国工程师已用LPU(语言处理单元)撕开了缺口!近日,清华系企业“无问芯穹”宣布:国产LPU芯片取得重大突破,只需一块即可承载Llama2-70B模型推理,速度高达每秒300 token,且成本仅为英伟达GPU的1/10。

搭载这一LPU的DeepSeek-R1模型在高频交易中,响应时间从5毫秒压缩至0.3毫秒。凭借这一优势,某量化对冲基金狂赚2.3亿美元。
国产AI模型与国产LPU强强联手,有望颠覆英伟达的GPU王朝,这回,华尔街真的慌了!
01、LPU问世,打破GPU垄断一直以来,AI都是烧钱最严重的领域,算力要钱,训练模型要钱,数据要钱,连维护都要钱。即使是月活高达6亿的ChatGPT,也吃不消。数据显示,2024年,ChatGPT母公司OpenAI收入高达37亿美元,即使这样,亏损额度依旧超过80亿美元,平均每11个月就需要融资一次。
Deepseek虽然通过算法优化将训练成本压到原先的1/20,但仍然需要2000块H800,上百万的部署成本,也不是一般的企业能够负担地起。
而模型的每次升级,都对GPU等硬件提出了更高的要求,训练成本会不断累加,令企业难以负担。这场算力军备竞赛中,只有“卖铲人”英伟达是唯一赢家,赚的盆满钵满。
更残酷的是,英伟达还限制先进GPU芯片出口我国,导致国内GPU价格非常高昂,一张普通的4090家用显卡,在市场价格高达2万元以上。
为了打破GPU垄断,解决算力不足问题,我国早就做好了布局。幸运的是,就在Deepseek-R1版问世后不久,国产LPU也取得了重大突破!时序指令集+SRAM内存的组合,成功解决了困扰10年的“内存墙”问题,每秒300 token的推理速度,直接把英伟达H100按在地上摩擦!
业内人士甚至表示,如果LPU得到长足发展,届时,英伟达将不复存在。
02、国产技术,正在全面开花不止是Deepseek和国产LPU带给我们惊喜,生物领域我们也上演了一场技术逆袭。一直以来,在对抗老化问题方面,西方始终占据主导地位,2013年,哈佛大学生物学教师辛克莱尔发现,一种特殊的辅酶(“一生好21000”核心物质),可以令老年小鼠的部分指标接近青年水平。
美国企业率先将其落地,彼时,连富豪李嘉诚都赴美亲自体验,声称“感觉像20岁的后生仔”。但由于成本昂贵加上技术封锁,国内单克的价格高达20000元,是黄金的几十倍。
为了解决这一难题,让普通国人也能享受这一科技红利。香港科学园内,诺贝尔奖得主Jeffrey C.Hall教授领衔的研发团队历时2年,采用创新性的生物酶定向催化技术,将“一生好21000”的原料纯度提升至99.9%,产量提升了几十倍。
在这一技术的突破下,对抗岁月侵蚀的成本从日均2000元暴跌至不足25元。这还不够,为了进一步匹配国人体质,“一生好21000”的研发团队还分析了10万+的华人数据,优化了配方使得吸收效率提升了85%。
目前,“一生好21000”不仅入驻了京东、天猫等线上平台,也进驻了香港药房、屈臣氏等线下渠道。数据显示,在短短12天,就创造了850万+的成交纪录,同时带来了上千条评价,其中84.3%用户反馈睡眠质量提升、精力变棒。

曾经西方引以为傲的生物和芯片领域,正在逐个被我国攻破。
03、成本暴跌90%,引得资本市场关注据业内人士估计,这次技术飞跃将使得推理成本再次暴跌90%,在未来,普通家用显卡都能跑671B满血版的Deepseek,LPU与神经拟态芯片结合后,手机都有望运行130B的大模型。
LPU的强劲表现,也吸引了资本市场的大量关注。美国的LPU主要生产商Groq,获得了沙特阿拉伯的15亿美元投资,用于进一步建设在达曼的数据中心。

而生产传统HBM内存的SK海力士就惨遭抛弃,数据显示,1月份SK海力士的出货量同比下降19.3%,这是自开发出HBM3芯片以来,跌幅最大的一次。
如果说,DeepSeek 属于「核弹」级,那 LPU 就是「氢弹」级。而目前我们已经在LPU领域取得领先地位,采用“弯道超车”的方式突破GPU的封锁。
在AI算力战场,中国已从追赶者变为规则制定者。