IT之家3月24日消息,据彭博社今日消息,知情人士透露,蚂蚁集团使用中国制造的芯片开发AI模型训练技术,这将使成本降低20%。
报道称,蚂蚁集团使用了包括阿里巴巴集团控股有限公司和华为技术有限公司在内的国内芯片,采用混合专家模型(IT之家注:MoE,Mixtureofexperts)机器学习方法。
报道还提到,训练结果与英伟达公司H800芯片匹敌。其中一名知情人士透露,蚂蚁集团仍在使用英伟达芯片进行AI开发,但现在主要依赖包括AMD和国内芯片在内的替代品。
报道认为,这凸显了中国公司试图使用本地芯片来替代最先进的英伟达半导体。蚂蚁集团本月份发布了一份研究报告,称其模型在部分基准测试中超过了Meta,如果按预期工作,蚂蚁的平台可能为中国AI发展迈出又一个新的步伐。
随着各大公司向AI投入大量资金,MoE模型已成为一种流行的选择,被谷歌和DeepSeek等公司采用而获得认可。该技术将任务划分为更小的数据集,非常类似于拥有一支专注于工作某个部分的专家团队,使过程更加高效。蚂蚁集团拒绝在电子邮件声明中发表评论。
报道还提到,蚂蚁集团一直在研究更有效地训练LLMs的方法,并消除高性能芯片限制。其论文标题清楚地表明,公司设定的目标是“不使用高端GPU”扩展模型。
这与英伟达的理念相反,英伟达CEO黄仁勋认为,即使随着像DeepSeekR1这样的更高效模型问世,计算需求也将增长,他认为各大公司需要更好的芯片来创造更多收入,而不是更便宜的芯片来削减成本。他坚持采用构建具有更多处理核心、晶体管的大型GPU策略。