AMD周四公布了其下一代AI芯片InstinctMI400系列的新细节,该系列芯片将于明年出货。
AMD称,MI400芯片可组装成名为Helios的完整服务器机架,这使得数千个芯片能够以“机架级”系统的形式连接在一起。
“我们首次将机架的每个部分设计为一个统一系统,”AMD首席执行官苏姿丰周四在加利福尼亚州圣何塞的发布活动上表示。
OpenAI首席执行官山姆・奥特曼与苏姿丰一同登台,并表示其公司将使用AMD芯片。
“当你第一次告诉我这些规格时,我心想,这不可能,听起来太疯狂了,”奥特曼说,“这将是一件了不起的事情。”
AMD的机架级设置将使芯片对用户而言像一个统一系统,这对大多数AI客户(如云服务提供商和开发大型语言模型的公司)至关重要。这些客户需要覆盖整个数据中心并消耗大量电力的“超大规模”AI计算机集群。
“可以将Helios视为一个真正像单个大型计算引擎一样运作的机架,”苏姿丰将其与英伟达预计明年发布的VeraRubin机架进行了对比。
AMD的机架级技术还使其最新芯片能够与英伟达的Blackwell芯片竞争,后者已配置72个图形处理单元(GPU)。英伟达是AMD在开发和部署AI应用的大型数据中心GPU领域的主要且唯一竞争对手。
AMD称,作为英伟达的重要客户,OpenAI一直在为其MI400路线图提供反馈。借助MI400芯片和今年的MI355X芯片,AMD计划在价格上与竞争对手英伟达展开竞争。该公司一位高管周三对记者表示,由于功耗更低,这些芯片的运行成本将更低,且AMD正以“激进”的价格削弱英伟达的市场份额。
到目前为止,英伟达在数据中心GPU市场占据主导地位,部分原因在于它是首家开发出AI开发者所需软件的公司,这些软件可让原本为3D游戏显示图形而设计的芯片发挥作用。在过去十年AI热潮之前,AMD专注于在服务器CPU领域与英特尔竞争。
苏姿丰表示,尽管英伟达使用其“专有”CUDA软件,AMD的MI355X仍可超越英伟达的Blackwell芯片。
“这表明我们拥有真正强大的硬件,这是我们一直知道的,但也表明开源软件框架取得了巨大进步,”苏姿丰说。
2025年迄今为止,AMD股价持平,这表明华尔街尚未将其视为对英伟达主导地位的重大威胁。
AMD数据中心GPU总经理安德鲁・迪克曼(AndrewDieckmann)周三表示,AMD的AI芯片将在运行成本和购置成本上更低。
“总体而言,我们在价格上有显著优势,再加上我们的性能竞争优势,因此能节省相当可观的两位数百分比成本,”迪克曼说。
未来几年,大型云公司和各国都准备斥资数千亿美元围绕GPU建造新的数据中心集群,以加速前沿AI模型的开发。仅今年,大型科技公司的计划资本支出就包括3000亿美元。
AMD预计到2028年AI芯片总市场规模将超过5000亿美元,尽管尚未说明其能占据多少市场份额——据分析师估计,英伟达目前占据超过90%的市场份额。
两家公司都承诺每年发布新的AI芯片,而非每两年一次,这凸显了竞争的激烈程度,以及尖端AI芯片技术对微软、甲骨文和亚马逊等公司的重要性。
苏姿丰称,AMD在过去一年收购或投资了25家AI公司,包括今年早些时候收购服务器制造商ZTSystems,该公司开发了AMD构建机架规模系统所需的技术。
“这些AI系统变得极其复杂,全栈解决方案确实至关重要,”苏姿丰说。
AMD当前的销售情况
目前,云服务提供商正在安装的最先进的AMDAI芯片是其InstinctMI355X,该公司称其已于上月开始批量出货。AMD表示,从第三季度开始,云服务提供商将可租用该芯片。
为AI构建大型数据中心集群的公司希望有英伟达的替代方案,不仅是为了降低成本和提供灵活性,还为了满足对“推理”(即实际部署聊天机器人或生成式AI应用所需的计算能力)日益增长的需求,这比传统服务器应用需要更多的处理能力。
“真正改变的是对推理的需求显著增长,”苏姿丰说。
AMD官员周四表示,他们认为其新芯片在推理方面优于英伟达的芯片。这是因为AMD的芯片配备了更多高速内存,使更大的AI模型能够在单个GPU上运行。
AMD称,MI355X的计算能力是其前身的七倍。这些芯片将能够与英伟达去年年底开始出货的B100和B200芯片竞争。
AMD表示,其Instinct芯片已被10大AI客户中的7家采用,包括OpenAI、特斯拉、xAI和Cohere。
AMD称,甲骨文计划向其客户提供包含超过13.1万个MI355X芯片的集群。
Meta官员周四表示,他们正在使用AMD的CPU和GPU集群来运行其Llama模型的推理,并计划购买AMD的下一代服务器。
微软代表表示,其使用AMD芯片为其CopilotAI功能提供服务。
价格竞争
AMD拒绝透露其芯片的成本——它不单独销售芯片,最终用户通常通过戴尔或超微电脑等硬件公司购买——但该公司计划让MI400芯片在价格上竞争。
这家位于圣克拉拉的公司将其GPU与2022年收购Pensando获得的CPU和网络芯片搭配,以构建其Helios机架。这意味着其AI芯片的更广泛采用也将惠及AMD的其他业务。与英伟达的专有NVLink不同,它还使用名为UALink的开源网络技术来紧密集成其机架系统。
AMD声称,其MI355X每美元可提供比英伟达芯片多40%的代币(一种AI输出的衡量标准),因为其芯片比竞争对手的功耗更低。
数据中心GPU每颗芯片可能耗资数万美元,云公司通常会大量购买。
AMD的AI芯片业务仍远小于英伟达。该公司表示,其2024财年AI销售额为50亿美元,但摩根大通分析师预计该类别今年将增长60%。