根据最新实测数据显示,NVIDIABlackwellGPU在AI训练推理性能方面表现出色。具体而言,两代服务器HGXB200和HGXH200的对比结果显示,前者配备了多达八颗BlackwellGPUB200,而单颗BlackwellGPUB200的功耗高达1000W。
在GPT-3预训练项目中,Blackwell的性能相较于上一代Hopper实现了翻倍增长。而在Llama2700亿参数微调项目中,Blackwell的性能更是提升了多达2.2倍。
值得一提的是,Blackwell平台采用了ConnectX-7SuperNICs网卡、Quantum-2InfiniBand交换机以及第五代NVLink互连总线技术。这些先进的通信设备可以保障节点间高效的数据传输,并实现负载平衡,进而提高整体效率。
举例来说,在同样具备1750亿参数性能的GPT-3任务下,使用Hopper需要部署多达256颗GPU;然而使用Blackwell只需部署64颗即可完成相同任务。