192核心384线程,AMD第五代EPYC给足AI算力

计算杂谈 2024-10-11 08:30:53

在当今这个日新月异的时代,人工智能犹如一股势不可挡的洪流,深刻影响着各行各业的发展轨迹。从医疗领域中的精准诊断到金融行业的风险评估,从智能交通系统的高效调度到制造业的自动化生产革新,人工智能正以史无前例的速度推动各行业迈向新的高度。在这背后,有一股不可忽视的强大驱动力——算力,它悄然支撑着人工智能在各个领域的卓越表现。可以说,CPU和GPU所提供的算力支持,是当前人工智能取得一系列辉煌成就的重要基石。

在科技的舞台上,Intel与AMD之间的较量始终吸引着世人的目光。不久前,Intel携128核的至强处理器亮相,在服务器处理器领域再掀波澜,意图扭转战局。但竞争的脚步却从未放缓,当地时间2024年10月10日,AMD基于“Turin”核心的Zen5架构EPYC处理器在美国旧金山正式发布,这款拥有192核的强大产品,将x86服务器处理器的性能推向了新的巅峰,科技之战再度升级。

EPYC:从挑战者走向领导者

一直以来在企业级处理器领域扮演着“挑战者”的AMD,其市场份额一直在攀升中,增长速度也足以让竞争对手汗颜。在此次大会上,AMD 董事会主席及首席执行官Lisa Su(苏姿丰)博士交出了一份相当给力的答卷,即:市占率增长至34%,有超过350个OEM平台及950个以上云计算实例。其影响力已渗透至我们日常工作与生活的方方面面,包括社交媒体、各行各业、搜索引擎、电子设备及视频会议等领域,EPYC处理器的身影无处不在。

值得关注的是,自2014年胜任CEO以来,苏姿丰博士就带领AMD一路前冲,10年来取得如此优秀的“成绩”足以被载入史册。

要知道,AMD EPYC在企业级市场这34%市占率的含金量非常高。2017年初代EPYC上市时,AMD市占率仅为0~2%,快速增长至今的成绩,若用“虎口夺食”来形容EPYC的发展也丝毫不为过。

在企业级IT领域,魔力象限是衡量产品或技术竞争力的一个重要参考,其中“领导者”和“挑战者”位置尤为引人注目。过去,AMD EPYC处理器常作为挑战者,凭借其卓越的核心数量、IO带宽及高效计算能力,在性能上展现出了显著优势。

然而,AMD此次推出的基于“Turin”核心的Zen5架构EPYC处理器,则设定了更为宏大的目标。即:巩固并扩展服务器处理器的领导地位,致力于实现更高效的现代化运算,并构建端到端的AI领导力,以全面满足现代数据中心不断演变的新需求。

新一代EPYC处理器以领导者的姿态亮相,使其更显耀眼。

192核心EPYC终成现实

为了实现领导者的目标,AMD Zen5架构EPYC依然通过硬实力来“打动”用户。

此次推出的第五代EPYC的闪光点之一就是单颗处理器支持高达384线程,核心数最高可达192个,史无前例。其中,配置了16个"Zen 5"CCDs(核心复合芯片)的处理器,提供了128个核心和256个线程。另一种更高端的配置,搭载了12个"Zen 5c"CCDs,提供了惊人的192个核心和384个线程。

此次EPYC最高主频也进一步攀升至5GHz,使其在面向AI等领域的高密度计算、机器学习、并行计算及HPC等应用的性能更加出色。

AMD将Zen 5架构称为“巨大的飞跃”,与Zen 4相比,Zen 5架构在指令获取与解码、整数执行、数据加载与存储以及浮点与向量运算等方面均有显著改进。据官方资料显示,Zen 5架构相比前代的IPC(每时钟周期指令数)性能平均提高了约17%,意味着在相同的时钟频率下,新处理器能够执行更多的指令,从而提高了整体性能。

Zen 5架构的EPYC处理器支持AVX-512指令集,这为AI和高性能计算应用提供了显著的加速。AVX-512是一种高级SIMD(单指令多数据)指令集,它允许处理器在单个时钟周期内处理更多的数据,从而提高性能。

AMD的Zen 5架构EPYC处理器采用了先进的制造工艺,其中核心复合芯片(CCD)使用了台积电的3纳米工艺,而中央I/O芯片(IOD)则采用了4纳米工艺。这种更小的制造工艺通常意味着更高的能效,因为更小的晶体管可以在相同的电力消耗下提供更好的性能,或者在相同的性能下消耗更少的电力。

AMD Zen 5架构的处理器在设计时就考虑了能效,它们在更低的运行温度和更低的热设计功率(TDP)下运行,这表明新一代处理器在节能方面做出了优化。这一点对于服务器领域尤为重要,因为大规模运行这些系统时,功耗和冷却将占据运营成本的很大一部分。

Zen 5架构EPYC处理器基于SP5平台构建,这意味着它们与现有的EPYC "Genoa"系列处理器向后兼容。这种兼容性允许客户在不更换整个系统的情况下升级他们的服务器,从而降低了升级成本并提高了投资回报率。

此外,AMD Zen 5架构EPYC处理器提供了从8核到192核的不同配置,以及155W到500W的热设计功率(TDP)范围,这使得它们能够适应各种不同的服务器和工作负载需求。这种广泛的性能扩展为客户提供了更多的选择,以满足不同的性能和能效要求。

新一代EPYC处理器支持12通道的DDR5-6400内存,提供了更高的内存带宽和容量。同时,其支持128个PCIe 5.0/CXL 2.0通道,为高速I/O和存储提供了更多的带宽和灵活性。

Zen 5架构的EPYC处理器支持可信I/O的机密计算,这为数据中心提供了额外的安全层,保护数据免受未授权访问和潜在威胁。这种安全特性对于需要处理敏感信息的企业来说尤为重要。

挑战更高性能

在技术与规格方面,AMD Zen 5架构EPYC展现出了强大的统治力,那么实战效果如何呢?

别急,上测试!

AMD官方给出的性能表现同样非常“炸裂”。与早期EPYC相比,Zen 5架构EPYC在SPEC标准测试、企业级应用、HPC和AI方面性能分别提升了2.7、4.0、3.9及3.8倍,而在GPU主机节点性能方面,AMD EPYC 9965是同类竞争对手的1.2倍。

企业级HPC性能方面,同样64核心配置下,AMD Zen 5架构的EPYC 9575F处理器在Ansys LS-DYNA的有限元分析(FEA)模拟中,相比第四代EPYC处理器(9554)和Intel第五代Xeon处理器(8592+),提供了高达1.6倍的性能提升。

在Ansys Fluent的计算流体动力学(CFD)模拟和建模中,Zen 5架构的EPYC 9575F处理器也展示出了比竞争对手更好的性能。

相同数量核心下,Zen 5架构展现出了强大的实力,这一代的升级非常给力。

在商业应用、图像渲染、视频转码和开源数据库测试环节,第五代AMD EPYC 9965处理器(192核心)与第五代Intel Xeon处理器(8592+,64核心)和第四代AMD EPYC处理器(9654,96核心)的比较中,AMD的处理器在多个领域实现了3~4倍的工作负载性能提升。

其中,在FFMPEG视频转码(raw to VP9)和SPECjbb2015多用户JVM基准测试中,AMD EPYC处理器的性能提升尤为显著。

在高性能计算方面,HPL(高性能线性求解器)和GROMACS分子动力学模拟等开源HPC应用中,Zen 5架构的EPYC 9965处理器相比第四代EPYC处理器9654和第五代Intel Xeon处理器8592+)测试对比,有着最高3.9倍的性能提升。

在NAMD-STVM20M分子模拟中,Zen 5架构的EPYC处理器也比竞争对手有着3.7倍的碾压式的性能优势。

优化TCO,1台服务器替换7台

“我知道你很厉害,但你一台服务器能打几个?”

答案是:7个!

与旧服务器相比,新一代的EPYC 9965服务器在性能上实现了高达7倍的提升,同时在功耗、服务器数量和三年总体拥有成本(TCO)方面实现了显著降低,分别减少了87%、68%和67%的消耗和成本。

AMD官方资料显示,对于企业而言,仅需购置131台基于EPYC 9965的服务器,就能够替代1000台旧款Intel至强8280服务器,高达7:1的替换比例可以为企业降低大量来自能耗、空间占用、运维等方面的成本,从而助企业实现更高效的运营效率。

与传统处理器相比,AMD Zen 5架构EPYC在人工智能,包括机器学习和推理等任务中性能表现更加出色。AMD还同时更新了Instinct Ml系列GPU及DPU产品阵营,构建起了一套完善的AMD企业级数据中心解决方案。

此次我们还看到了包括戴尔、HPE、思科、超威、联想、华硕、技嘉等众多合作伙伴,均推出了大量基于Zen 5架构EPYC的服务器产品。

同时,AMD还进一步与微软、谷歌、甲骨文、Meta等企业合作,为其提供AI算力支持。

随着AI技术的飞速发展,各行各业对算力的需求日益高涨,也对企业级处理器提出了前所未有的挑战。在这样的背景下,AMD推出的基于Zen 5架构的EPYC处理器,无疑为企业用户带来了强大的性能保障。它不仅在核心数量、IO带宽及计算效率上提升明显,更在成本效益、运维便捷性及系统可靠性等方面展现出了更多优势。

可以看到,当今的AMD正在以EPYC为切入点来战略布局整个数据中心,巩固AMD在企业级处理器市场领先地位的同时,也为AI时代所面临的竞争奠定了坚实的基础。

0 阅读:16

计算杂谈

简介:聊聊一切与计算相关的话题