拆解服务器五大关键组件
"AI服务器五大硬件揭秘:深入剖析PCB构造,揭示内部真实面貌。本文通过一步步拆解PCB,为读者呈现了一台服务器的内部世界,力求让您对服务器升级的潜在价值有更深的理解和把握。"
1、五大硬件部分可归纳为——GPU 板组、CPU 母板组、配件
英伟达DGX A100和DGX H100是两款具有标杆性产品力的产品。由于H100发布时间较短、资料详尽度不够,我们首先从DGX A100出发来观测具有产品力的AI服务器的基本架构。英伟达DGX A100外形类似于常见的家用主机,通过对部件构成进行深度分解,我们认为DGX A100大体上可以分为五个硬件板块。
优化后的文章如下:
从前部(Front)入手,首先映入眼帘的是风扇模组板块。DGX A100的风扇模组由8个高效风扇组成,这一设计巧妙地与传统服务器8U规格保持一致,为您的计算环境带来更强大的散热性能。
DGX A100 的硬盘和前控制台板被巧妙地安放在机箱的前部风扇模组板块下方,这款AI加速器拥有8块3.84TB的硬盘,为用户提供了高达30TB的超大内部存储空间。
您好,AI 服务器的 GPU 板组是整个服务器最为核心的组件组装区域之一,也是 AI 服务器区别于普通服务器的关键。从 DGXA100 的架构来看,GPU 板组主要包含 GPU 组件、模组板、NVSwitch 三块,这三块都会涉及到不同类型的 PCB 产品。
CPU 母板组是所有服务器的核心部件之一,其中包含 CPU 母板、系统内存、网卡、PCIE Switch 等部件。CPU 母板、系统内存、网卡是主要涉及到 PCB 用量的部分。
AI服务器的PCB价值量计算可归纳为三大部分:1. 核心GPU板组,2. 必备CPU母板组,3. 风扇、硬盘、电源等配件组。本文将详细解析这三大模块。
2、GPU 板组:单机价值量 1.2 万,载板占比 52%、PCB 板占 48%
GPU 板组的 PCB 主要由 4 个部分组成,GPU 载板、NVSwitch、OAM、UBB。其中,GPU 载板是英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元 。
1) GPU 载板,英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元。
NVSwitch,一种基于NVLink标准的GPU间通信基础模组,其载体为载板式产品。加工性要求简单,关键在于承担大量高速数据传输任务。据产业链调研,单颗NVSwitch的价值约为30美元,即195元/颗。若A100搭载6颗NVSwitch,则单机价值量可达1170元。
3) OAM,OCP Accelerator Module,中文简称 GPU 加速卡,是用于承载 GPU 芯片的板卡,数量上看 OAM 与 GPU 存在一一对应的关系,以 DGX A100 搭载 8 个 GPU 的数量来看,1台 AI 服务器需要用到8块 OAM;面积上来看,借鉴 PCIE 版本 267.7mm*111.15mm的尺寸规格(内部 PCB 规格与外壳规格基本一致),可测算出 OAM 的面积尺寸约为0.03 平方米;
PCB 板型上来看,由于 OAM 涉及到 GPU 高速多线路信号传递,根据产业链调研,DGX A100 OAM 的 SXM 版本需要用到 20 层、Ultra Low Loss 等级 CCL 材料、4 阶 HDI 工艺,对应产品单价为 12000 元/平方米,DGX A100 OAM 的 PCIE 版本相对规格较低,只需要用到 14 层、Ultra Low Loss 和高 Tg FR4 等级 CCL 材料混压、1 阶 HDI 工艺,对应产品单价 7000 元/平方米。综合来看,如果按照 DGX A100 机型配置,高端 AI 服务器的 OAM 单价价值量将达到 2880 元。
UBB,即Unit Baseboard,是专为搭载GPU平台设计的PCB板。每台AI服务器将配备一块UBB,据DGX A100整机底面规格和产业链调研显示,预估UBB的面积约为0.30平方米,需使用26层通孔PCB板。采用Ultra Low Loss CCL材料,单价约为10000元/平方米,对应单机价值量为3000元。
英伟达DGX A100 GPU板组包括GPU载板、NVSwitch、GPU加速卡和GPU模组板四部分,总单机PCB面积达0.624平方米,对应单机价值量为12,250元。其中,载板级别的产品占52%,单机价值量为6,370元;PCB级别的产品占48%,单机价值量为5,880元。
3、CPU母板组:单机价值量2845元,载板占46%、主板占40%
CPU母板组包括:CPU载板、主板和配板。其中,功能性配板如系统内存卡、网卡、拓展卡和存储操作系统驱动板。
CPU载板与GPU载板规格相近,单颗CPU载板价值量100美元。若DGX搭载2颗CPU,则单机价值量约为1300元。
2)CPU 主板,主要用于承载 CPU 芯片、PCIE Switch 芯片、TPM 模组及各种功能性配板卡,该类 PCB 板的规格主要由 CPU 平台设计和总线标准,按照 DGX A100 的方案主要采用 64 核 AMD Rome 的 CPU 芯片、总线标准仍然为 PCIE 4.0,因此 CPU 主板仍然采用 10~12 层、Low Loss 等级 CCL 材料、通孔板的设计,根据产业链调研,单价约为3000 元/平方米;按照 DGX A100 的尺寸规格设计,估测 CPU 主板面积为 0.38 平方米,由此可计算 CPU 主板单机价值量为 1140 元。
根据产业链调研,功能性配板通常采用8-10层板、Mid Loss等级CCL,单价约为1500元/平方米。若参照DGX A100,面积和数量可参考该规格。
英伟达DGX A100服务器配备了Mellanox ConnectX系列产品,其中包括X-7和X-6型号。标配的网卡数量为10张,包括8个单端口200Gb/s的IB和2个双端口200Gb/s以太网。据英伟达官网披露,Mellanox ConnectX-7的尺寸为68.90mm x 167.65mm。通过计算,我们可以得出单块网卡板的面积约为0.012平方米/张。在DGX A100服务器中,为了充分利用板卡摆放设计,需要添加一些拓展卡来扩展PCIe接口。由于该服务器配备了一张横置的Storage networking网卡,因此需要一张专门的拓展卡。据产业链调研显示,每张拓展卡的面积约为0.01平方米。DGX A100的存储操作系统驱动板,拥有2个1.92TB M.2 NVMe系统驱动器,巧妙地设计在一张PCB板上的两面。这样独特的布局,让系统驱动板仅有1块,面积约为0.01平方米/张,实现了高性能与紧凑设计的完美结合。上述四部分合计,功能性配板单机面积为0.27平方米,对应单机价值量约为405元。
经过综合分析,英伟达DGX A100 CPU母板组PCB用量总面积约为0.662平方米,单机价值约2845元。其中,载板级产品占46%,主板产品占40%,配板产品占14%。
4、其他配件:单机价值量合计 226 元
除了GPU板组和CPU模板组,其他配件还包括电源、硬盘、前控制台板等。根据产业链调研,这类产品主要采用6~10层、FR4/Mid Loss等级CCL的规格,单价约为1000~1500元/平方米不等。参照DGX A100规格对用量和面积进行计算,可得出相应的成本。
DGX A100配置了6个电源,与台达电2200W服务器电源DPS-2200-AB-2型号相似。根据其73.5*265.0mm的规格,我们估计每个电源所需的PCB板面积约为0.019平方米。
2)DGX A100搭配8个硬盘,根据行业标准3.5英寸盘,估测单块硬盘PCB面积为0.008平方米。
3) 前控制台板:用于控制外接设备,置于8个硬盘间的一块PCB板。据产业链调研,估测面积约为0.010平方米。
经过综合分析,我们预测DGX A100整机的PCB用量面积约为1.474平方米,单机价值量为15321元。其中,GPU板组单机价值量最高,达到1.2万元,占比达80%;CPU母板组单机价值量为2845元,占比19%;其他配件单机价值量为226元,占比1%。从板级分类来看,载板级别单机价值量为7670元,占比50.1%;PCB板级单机价值量为7651元,占比49.9%。
-对此,您有什么看法见解?-
-欢迎在评论区留言探讨和分享。-