马斯克:在特斯拉,我们基本上有两个不同的芯片项目:一个是Dojo(项目已经搁置),另一个是我们称为AI4的推理芯片。
AI4 是目前所有车辆搭载的芯片,我们正在最终确定AI5的设计,它将比AI4有巨大飞跃。按某些指标,AI5的性能将是AI4的40倍,不是40%,而是40倍。
这是因为我们在AI软件和AI硬件层面进行了极其精细的紧密协作。我们精确知道瓶颈在哪里。因此,AI硬件和软件团队实际上是联合设计芯片。
相比AI4最严重的限制——运行SoftMax操作,目前我们必须在模拟模式下用约40步完成,而在AI5中,这将原生只需几步即可完成。
AI5还能轻松处理混合精度模型,无需手动设置,它会动态处理混合精度。还有很多技术细节,AI5会做得更好。
就标称原始算力而言,AI5拥有8倍算力、约9倍内存和约5倍内存带宽。
但由于我们针对AI4的核心瓶颈进行了优化——在硅层面精细调整了当前AI4中次优的部分——将8倍算力提升再乘以约5倍的优化提升,从而实现40倍整体改进。