近期有外媒报道称,字节跳动计划与台积电展开合作,在2026年前开始量产其两款基于5nm工艺的自研AI芯片,或将预定数十万枚芯片的产量。
据悉,这两款芯片分别针对模型训练和推理设计。“训练芯片”用于加速构建AI模型所需的大量数据计算;“推理芯片”则用于加速基于模型的预测和决策过程。这些芯片当前仍处于设计阶段,其性能与英伟达即将发布的Blackwell架构芯片相当。
知情人士表示,通过生产自家研发的芯片,字节跳动可以减少对英伟达GPU的依赖,从而大幅降低AI模型开发和运营过程中的高额芯片采购成本,在中国AI聊天机器人市场上超过其竞争对手。
9月18日,字节跳动官方回应称此报道不实。字节方面表示,公司确实在芯片领域进行了一定程度的探索,但仍处于初期阶段,主要是围绕推荐、广告等业务的成本优化,所有项目也完全符合相关的贸易管制规定。
随着中国AI产业的发展,本土AI开发商之间的竞争正在酝酿之中。
去年6月,字节推出旗下首款AI聊天机器人“豆包”,提供了类似于OpenAI ChatGPT的文本和图像生成功能,并一度成为百度“文心一言”的强劲对手。统计数据显示,“豆包”在中国大陆的iOS下载量和月活跃用户均超过了“文心一言”。
今年5月,字节又陆续推出了一系列针对企业客户的“豆包”大语言模型,得益于其低廉的开发与生产成本,其产品定价比OpenAI同类产品的价格低了将近99%,而竞争异常激烈的AI市场孕育了愈发严苛的价格战,百度、阿里等中国科技巨头纷纷将模型价格大幅下调,降幅高达97%。
与此同时,字节跳动在开发生成式AI模型方面的费用也在不断上升,今年已订购了超20万颗英伟达H20芯片,订单总金额超过20亿美元,目前仍在等待英伟达交付全部订单。
多年来,字节一直致力于推理芯片的研发工作,而设计训练芯片的难度更大,成本也更高。
根据知情人士的解释,字节此次芯片设计很大程度上是因为美国的出口限制(如AI芯片等关键技术的出口),而由于美国政府可能会不时更新相应条款,这些芯片的未来供应或将面临合规风险。
H20是美国出口管制下允许出售给中国的最先进英伟达芯片,其性能是H100(英伟达当前最先进芯片)的四分之一,因此,国内厂商需要购买更多的H20来为单个集群实现同等算力,这无疑增加了成本。
在这种情况下,字节降低芯片成本至关重要。字节的芯片研发工作遵循了谷歌、亚马逊和微软等公司近年来的做法,即在开发和运行AI模型方面减少对英伟达芯片的依赖,部分公司还为其云计算服务的客户提供了自家设计的芯片,作为英伟达芯片的替代品。
根据最新计划,若字节自研芯片成功投入使用,将节省数十亿美元的开支,公司也希望该芯片集群能够以同等成本实现单个H100的四倍计算性能。据了解,H100芯片的价格最高可达3万美元。
今年6月,有外媒报道称字节正与博通合作开发一款5nm制程的ASIC芯片,该处理器将符合美国出口规定,由台积电负责生产。虽设计工作顺利进行,但“流片”工序迟迟未开始。此后,字节又否认了与博通合作的传闻。
去年,字节还收购了华为的Ascend 910B芯片。
自研AI芯片之路上,字节并不是独行者。近年来,腾讯、百度、阿里等国内互联网巨头均加大了在AI芯片领域的投资。据称,百度的自研AI芯片“昆仑3”已进入设计的最后阶段,即将交由台积电开始生产。