英伟达推出2款新AI硬件,H200 NVL PCIe GPU和GB200 NVL4。
英伟达表示约七成的企业机架仅可提供不到20kW的电力供应,并采用空气冷却,而PCIe AIC形态的H200 NVL就是为这些环境推出的相对低功耗风冷AI计算卡。
H200 NVL为双槽厚度,最高TDP功耗从H200 SXM的700W降至600W,算力也有一定下降 (INT8 Tensor Core算力下滑约15.6% ),不过HBM内存容量和带宽是与H200 SXM相同的 141GB、4.8TB/s。
H200 NVL PCIe GPU支持双路或四路的900GB/s每GPU的NVLink桥接器互联。
H200 NVL内存容量是此前H100 NVL的1.5倍,带宽也达1.2倍,拥有1.7倍的AI推理性能,在HPC 应用中性能也高出30%。
英伟达此次还推出了面向单服务器解决方案的GB200 NVL4超级芯片,聚合了2个Grace CPU和4个 Blackwell GPU,HBM内存池容量达1.3TB,相当于2组GB200 Grace Blackwell超级芯片,整体功耗5.4kw。
相比于包含4个Grace CPU和4个Hopper GPU的上代GH200 NVL4系统,新的GB200 NVL4拥有 2.2倍的模拟性能、1.8倍的AI训练性能和1.8倍的AI推理性能。
GB200 NVL4超级芯片2025年下半年上市。