AMD在2022年底发布了EPYC 9004处理器,通过强悍的Zen 4架构以及最多96核心的配置,带来了企业级产品又一次性能上的飞跃。虽然96核心对日常应用来说,听起来已经太多,但是对更在乎数据带宽,要求计算环境高效、敏捷、可扩展能力强的云计算服务商、云计算应用而言,核心数量自然是多多益善。
于是,2023年AMD通过工艺缩减、物理结构调整以及L3缓存的减半,带来了只有2.48平方毫米面积的Zen 4c CPU核心,相比之前Zen 4的3.84平方毫米,缩减了35%,这样将使得AMD有条件在1个CCD中集成16颗Zen 4c核心,并使用8个CCD完成128核心的配置。AMD的数据显示,拥有16个Zen 4c核心的CCD,面积为72.7平方毫米,而8个Zen 4核心的CCD是66.3平方毫米,AMD使用仅多9.6%的面积空间,使得核心数量翻倍。
🔺Zen 4c的核心面积相比Zen 4更小
AMD推出了3款采用Zen 4c核心的EPYC 97X4处理器,具体型号包含:EPYC 9754、EPYC 9754S和EPYC 9734。这三款处理器都拥有256MB L3缓存,均支持12个DDR5内存通道,可以提供128条PCIe 5.0通道。其中前两款处理器拥有最多128个CPU核心,但是第二款不支持SMT技术,因此只有128个线程。最后一款缩减至112核心224线程,相对应功耗也略低一些。
🔺基于Zen 4c核心的AMD EPYC 9754处理器,拥有128颗核心、256线程。
通过《微型计算机》评测室的实际测试数据来看,相对于核心数更少的产品,EPYC 9754双路系统在SPECrate 2017、NAMD、OpenSSL、UnixBench、V-RAY 5.02等几乎所有测试中都取得了领先,最大领先幅度可以达到23.5%,这也体现出EPYC 9754处理器的128颗Zen 4c核心的确拥有不凡的算力,能够在与云计算相关的应用与运算中大显身手,在如科学计算、OpenSSL生成签名、图形渲染等应用中,EPYC 9754都具备明显的优势,将为用户带来更高的工作效率,创造更多的价值。
1.1GB缓存除了推出Zen 4c产品外,AMD在2023年的另一个重要的创新在于继续将3D V-Cache技术引入企业级市场,推出面向缓存敏感型市场的、代号“Genoa-X”的EPYC 9084X系列处理器。
🔺拥有1152MB 3D缓存的EPYC 9684X处理器采用SP5 LGA6096封装,不论是在处理器大小面积,还是处理器厚度上与其他产品都没有区别。
EPYC 9084X系列处理器总共包括EPYC 9684X、EPYC 9384X和EPYC 9184X三款产品,其型号后缀都带一个“X”,这也是所有3D V-Cache产品独有的标识。3D V-Cache技术我们了解得很多了,主要是AMD使用独家混合键合技术,通过密集的硅通孔打通CCD上层并连接缓存,使得CCD上方拥有额外的64MB高速SRAM。因为其拓展的方向是向上,也就是Z轴垂直方向,因此AMD称其为3D V-Cache。目前每个EPYC 9004处理器中拥有总计12个CCD的话,最多可以增加768MB L3缓存,再加上原有的384MB,总计最高可以实现1152MB L3缓存。
从《微型计算机》的实际测试来看,只要是缓存敏感型应用,包括libxsmm、C-ray光线追踪,以及HeFFTe、OpenFOAM、NAS Parallel Benchmarks等流体动力学计算,3D V-Cache都显示出了极强的性能优势,其性能提升幅度最多达到了67.5%,其余的在20%~25%不等,最少的也有8%左右,为这类应用提供了更高的性能,值得肯定和称赞。
锐龙线程撕裂者在Zen架构问世的这6年多时间里,只要每一代Zen架构发布,除了推出像锐龙9 7950X这类面向普通用户的消费级处理器外,AMD也势必发布基于新一代Zen架构、面向工作站、内容创建用户、HEDT平台的锐龙线程撕裂者处理器。
这也令该系列产品的性能越来越强,其核心数量不仅随着生产工艺的进步增加,新架构的使用也有效提升了每颗核心的IPC性能,毕竟每代Zen架构较上一代Zen架构的提升幅度几乎都在10%以上,并带来了更强大的扩展能力,以及对各类新技术、新标准的支持。所以,在基于Zen 4处理器架构的AMD锐龙7000系列处理器发布约一年以后的2023年,AMD毫不意外地为用户带来了基于Zen 4架构、5nm生产工艺的第五代锐龙线程撕裂者处理器:锐龙线程撕裂者Pro 7000 WX以及锐龙线程撕裂者7000系列。
🔺靠左的两颗处理器为锐龙线程撕裂者Pro 7995WX,可见它内置了12个CCD,最右侧为锐龙线程撕裂者7980X,它的内部左右各布置了4个CCD,围绕着中间的IOD(I/O功能芯片)。
AMD推出了6款锐龙线程撕裂者Pro 7000WX处理器产品,其中最高端的产品是锐龙线程撕裂者Pro 7995WX,96核心192线程,最高频率5.1GHz,基准频率2.5GHz,TDP 350W,其余还推出了64核心、32核心、24核心、16核心和12核心的产品。而定位稍低的锐龙线程撕裂者7000系列则由3款处理器组成,分别是锐龙线程撕裂者7980X、7970X以及7960X,最大核心与线程数量分别为64核心/128线程、32核心/64线程和24核心/48线程,最高频率分别为5.1GHz、5.3GHz和5.3GHz,TDP功耗值全部都为350W。
根据《微型计算机》评测室实际测试,即便是定位稍低的锐龙线程撕裂者7980X、7970X在实际的处理器渲染性能、压缩性能测试、光线追踪计算、SHA3-512哈希算法等测试中就远远领先于酷睿i9-14900K、酷睿i9-13900K这类消费级旗舰处理器,拥有无可匹敌的专业性能,在2023年成为用户搭建工作站、内容创建平台的最优选择之一。
从4到5英特尔在2023一开年就发布了第四代至强可扩展处理器:Sapphire Rapids,从架构角度来看的话,第四代至强可扩展处理器CPU核心微架构采用是和桌面处理器一样的Golden Cove微架构,相比之前的第三代产品所采用的Sunny Cove架构,整体IPC提升了大约15%。
第四代至强可扩展处理器的一大进步是在核心数量上奋起直追,最多拥有60个内核,比第三代Ice Lake至强处理器提升了50%,计算能力则提高了53%。除了核心配置方案外,英特尔还带来了多种加速器配置,包括英特尔AMX、英特尔vRAN AVX、英特尔IAA等加速器配置方案,整体总计拥有15个加速器。
而在2023年年末的12月15日,英特尔还正式发布了代号为“Emerald Rapids”、面向数据中心的第五代至强可扩展处理器。新一代至强处理器基于Raptor Cove架构的P-Core性能核心,其中旗舰产品至强8592+的核心数量提升到了64颗核心、128个线程,并配备高达480MB的三级缓存,支持DDR5 5600内存、80条PCIe 5.0通道。
第五代至强可扩展处理器Emerald Rapids最大的改进在于嵌入的加速器引擎提供了最新的AMX(高级矩阵扩展),并由一套利用优化的开源框架和工具的可靠AI软件套件提供支持。英特尔表示,与第四代至强处理器相比,第五代至强将提供更高的TCO和性能/价格收益,同时为客户提供简单、方便的升级路径,毕竟第五代至强使用了与第四代产品相同的插槽和平台。
🔺在一年之内,英特尔就放发布了两代至强处理器,其年末发布的第五代至强处理器在性能上也获得了明显提升。
根据英特尔的公开数据显示,相较上一代产品,第五代英特尔至强可扩展处理器可在进行通用计算时将整体性能提升高达21%,AI推理性能提升了42%,云计算性能提升23%,5G网络用户面功能提升50%,图像分类和目标检测性能提升24%,并在一系列客户工作负载中将每瓦性能提升高达36%。对于遵循典型的五年更新周期、从更前一代处理器进行升级的客户而言,总体拥有成本最多降低77%。仅仅一年内,英特尔的至强处理器在性能上就获得了飞跃式的进步。
不过到本文截稿时,我们还不清楚其整体性能、市场布局和AMD的同类产品相比的竞争力如何,但可以预见的是,在2025年,第五代至强可扩展处理器将成为英特尔攻克服务器市场的主力军。