用国产芯片训练AI,成本降了20%?今日蚂蚁集团采用了包括阿里巴巴,和华为在内的国产芯片训练AI模型,最终得到的结果与使用H800芯片训练效果差不多,但成本降低了20%,这到底是蚂蚁集团的技术突破,还是被美国芯片禁令逼到墙角的无奈之举?
蚂蚁集团这次的操作,核心有两条:用国产芯片,将其堆砌在硬件之中;再用混合专家模型(MoE),以此来提升效率。
从华为的昇腾到阿里的含光,这些国产芯片单独拿出来,或许难以与英伟达的王牌相抗衡。不过蚂蚁采取了田忌赛马的行动策略,将复杂的AI训练任务分解成小块,让不同芯片各自展现其能力。比如动态地进行参数分配,使低性能芯片处理简单数据,而高难度任务则交给算力更强的模块,竟然将综合成本降低了百分之二十。
更狠的是,自适应容错技术,让训练过程,能够容忍硬件的失误,从而省下因重头,而带来的算力损耗;混合精度调度,就像是一位精打细算的管家一样,能让芯片在不同的场景下,切换其运算模式,甚至连小数点后几位的电费都要节省下来。
并且蚂蚁集团慷慨地表示:我们会逐步开源。把优化后的训练框架DLRover予以开放,以降低中小企业的AI门槛。试想一下,当更多开发者借助蚂蚁的方案来适配华为、阿里芯片时,这些国产硬件便会形成事实上的标准,最终有没有可能将英伟达挤出中国市场?
但开源的同时也是一把双刃剑。论文表明,蚂蚁的Ling-Lite模型,在英语测试当中,碾压MetaLlama;在中文场景里,更是吊打DeepSeek,这哪是技术分享?分明是在用开源,来换取市场话语权。
黄仁勋称,唯有更好的芯片方可创造价值;而蚂蚁却以行动表明,用更为省俭的芯片也能存活下去。这也折射出了中国AI企业所面临的集体性窘境:
算力焦虑:美国一纸禁令,让中国AI公司从拼算法变成拼库存;
生态断层:国产芯片单打独斗多年,直到今天才借AI训练找到应用场景;
成本陷阱:大模型训练烧掉的钱,比某些独角兽公司的估值还高;
不过从另一个角度思考,这种“戴着镣铐跳舞”的状态,反而促成了更坚实的技术突破。就比如昔日的航天事业,依靠算盘,成功实现了两弹一星的壮举;如今中国的人工智能企业,通过自主研发的芯片以及算法改进,顽强地挑战算力的极限,这又何尝不是一场新的技术征途呢?
当我们在为20%的成本下降欢呼时,别忘了另一个数字,全球AI算力市场,英伟达仍占据90%份额。
蚂蚁的尝试值得点赞,但真正的胜利不是用国产芯片替代H800,而是让国产芯片长出H800没有的能力。毕竟跟着别人定规则的游戏,赢得再漂亮也只是亚军。