在2024年的Computex大展上,富士康子公司Ingrasys的展台上矗立了一块独特的Nvidia HGX B200主板。这块主板的亮点在于,它没有安装散热片。仔细观察,我们可以发现NVLink Switch Chip的数量从H100的4个减少到了2个,而且它们的位置也发生了变化。这一创新设计无疑为未来的硬件发展开辟了新的可能性。
第一代NVSwitch
第一代NVSwitch是随着Nvidia的DGX-2计算机的推出而引入的。第一代NVSwitch是一个拥有20亿晶体管、18个端口的NVLink switch。每个端口以50 GB/s的速度运行,Switch的总带宽为900 GB/s。该交换机允许最多九个设备中的任何一个被路由到其他九个设备中的任何一个。除了NVLink端口,交换机还有额外的控制和管理的I/O接口,包括x4 PCIe Gen 2管理端口、I2C和GPIO。
DGX-2使用每块基板6个NVLink来创建GPU的全连接网络。
DGX-2拥有两块基板,全面连接了所有16个V100 GPU。每个交换机有两个未启用的端口,这些端口可能会在配置中使用POWER9微处理器,因为它们原生支持NVLink 2.0。
下图展示Inspur NF5488M5 HGX2的NVSwitch散热片,共6个,清晰可见。
第二代NVSwitch
在NVIDIA A100时代,NVSwitch散热器扩大,HGX A100平台由NVIDIA构建、预组装并发给供应商。
Inspur NF5488A5搭载NVIDIA HGX A100,6个NVSwitch散热片助力卓越性能。
第三代NVSwitch
H100这一代,4个NVSwitch在基板的一侧。
这是ASUS ESC N8A E12 NVIDIA HGX H100 。
下面是Nvidia HGX H200,看上去与HGX H100的设计非常相似。
第四代NVLink Switch
带着散热片的HGX B100
发布会上的HGX B100图片
"通过一款无散热片设计的HGX B200主板,我们可以清楚地看到NVLink Switch芯片的安装位置。经NVIDIA官方确认,这款主板上的NVLink Switch芯片与B200版本保持一致。"
在这里,我们可以观察到PCIe Retimer露出散热器。这些Retimer通常搭载较小的散热器,因为它们的TDP大约在10-15W之间,具体取决于您所讨论的是Astera Labs、Broadcom还是Marvell的此尺寸版本。
结论
NVLink Switch芯片体积更大,将它们移动到主板中央可能有助于减少迹线长度。这对于进行高速信号传输是有益的。此外,NVIDIA B200 GPUs的四个GPU集合在两侧,这样做,进一步减少了GPU到NVLink Switches的迹线长度 。
参考资料:
请访问 servethehome.com,了解英伟达(NVIDIA)展示的大型 NVLink 交换芯片如何切换到 HTX B200 和 B100。
-对此,您有什么看法见解?-
-欢迎在评论区留言探讨和分享。-