Zen5架构新一代处理器,几乎同步在移动与桌面平台上发布和上市。锐龙 9000桌面产处理器初期推出的4款“X”结尾的开放超频版本,直指DIY市场的垂直升级。有意思的是,AMD在代际间性能对比时,着重提到了9700X与5800X3D之间的比较,对,你没看错,是对比5800X3D——初代3D V-cache。
3D V-cache可以为包括游戏在内的应用提供计算之外的性能加持,也为众多玩家所津津乐道,但是其成本阻碍了普及。如今,仅以2000元出头的价格,锐龙 7 9700X就提供了更优的性能,拿下“7”这一核心消费层级。AMD实现了这一夙愿了吗?通过首发测试,“7”之对标,将给出我们答案。
除了处理器本身价格的下降,锐龙 9000系列的平台向下兼容,主板价格亲民,再加上9700X的功耗较低,散热和供电方面的麻烦都更少,从根上解决了不少令DIYer捉襟见肘的问题,可以说对新装机和升级都非常友好。
架构演进
从AMD之前释放的技术资料来看,Zen 5架构的主要设计目标是提升单线程~双线程下的性能表现,同时完善AVX-512(AVX即Advanced Vector Extensions,高级矢量扩展)指令集的支持,进一步提升浮点计算的吞吐量以实现更好的AI运算性能,为未来的计算核心架构奠定基础。
基于上述的设计目标,Zen 5架构的改进方向主要包括:提升每周期可执行指令的数量,更大数据宽度的调度与执行单元以及数据缓存和带宽翻倍。例如Zen 5的前端升级为双通道预读取和解码单元,并引入高级分支预测技术,优化分支预测与预取Zero-bubble分支,L1/L2分支目标缓冲区从上代的1.5K/7K大幅扩大至16K/8K,目标地址生成引擎也更大,返回地址堆栈现在扩大到52个条目,这些改动实现了更低的延迟,提高预测准确性和吞吐量。同时减少指令缓存的延迟并提升带宽,从而有效的提升了指令处理速度和准确性。
整数执行单元同样实现了规模的扩增:分配/回退增加到8通道(Zen 4为6通道);每个整数执行单元增加到6个ALU和4个AGU,相比上一代提升了50%和33%,6个ALU包含3个多乘法器和3个分支单元,4个AGU可每周期处理4个内存地址;其他的改进还包括延长执行窗口期,调度器增加到88 ALU和56 AGU,物理寄存器扩容到240条目,核心缓冲区增加到448条目。的更大的计算资源规模在面对复杂的并发工作负载时将会带来更好性能表现。
从Zen 4引入的AVX-512指令集在Zen 5上也得到了升级。相比之前使用256bit SIMD时需要2个周期来执行AVX-512指令,Zen 5实现了完整的512bit数据位宽,新的执行单元拥有更高的带宽与更低的延迟,拥有4条执行管线,2条LS/整数寄存器管线,每周期可执行2条512bit的加载和1条512bit存储。显著提升的浮点运算能力显然是希望能够更好的应对未来可能爆发性出现的各种AI应用。
Zen 5的一级数据缓存容量从32KB增加到48KB,宽度增加到12路,每周期4次读取与2次写入——这使得Zen 5的一级缓存和浮点单元的最大带宽相比Zen 4实现了翻倍。新的取指管理隐藏了L2和表遍历延迟,L2指令地址转换缓存扩大到2048个条目。缓存延迟与带宽方面可支持每周期64字节的取指,并实现了两个指令取指流并发。上述改进提升了处理器从缓存中获取指令的效率,从而提高了处理器的吞吐量和性能。
诸多改进的加持下,最终Zen 5的IPC相比Zen 4提升了16%。这个提升幅度显著高于Zen 4发布时宣称的10% IPC改进,略低于Zen 3的 19%的IPC提升。回想Zen 3对整个CPU市场带来的巨大影响,这次的Zen 5显然非常值得期待。
Zen 5架构包含了两种为不同应用场景优化设计的核心,其中Zen 5针对桌面市场,已优化单线程性能为主要目标,拥有更高的主频和更大三级缓存,当然也会带来更大芯片面积和功耗。Zen 5c则强调扩展性和能效比,在架构设计上与Zen 5保持一致,但频率更低,三级缓存更小。AMD的官方数据是内核面积要比Zen 5小25%,如果算上三级缓存将会节省更多的面积。Zen 5c将用在移动处理器Strix Point中。
性能测试
本次测试的是Zen 5首发型号中定位性能级的锐龙 7 9700X。使用一颗完整的Zen 5 CCD,配备8核心16线程,基准频率4.8GHz,最高频率可达5.5GHz,拥有8MB二级缓存+32MB 三级缓存,TDP只有65W。我们在测试中也选择了Intel同样定位于性能级的Core i7-14700K来进行对比。
在开始测试之前,我们想先寻找下锐龙 7 9700X的内存频率甜点位置。从之前的沟通得到的消息,Zen 5的内存甜点位是6400MHz,此时FCLK频率和内存频率可以维持在1:1模式,继续升高内存频率,则比例会切换到至1:2。但测试的这颗CPU却只能在6000MHz的时候维持1:1设定。也许体质更好的芯片目前还都是用在锐龙 9 9950X / 9900X上面吧。从测试结果看,内存频率要上升到6800MHz之后,才能弥补会FLCK降频的影响,因此对于锐龙 7 9700X的用户来说,如果不追求极致性能,那么目前市面上大多数6000MHz~6400MHz的DDR5内存都足够。而如果想充分榨取CPU的内存性能,则至少要6800MHz以上的频率才可以有正向收益。下面的测试,则都是基于7200MHz的内存设定。
在基准测试中,我们使用较多的基于实际应用的Benchmark来更好的评估CPU在实际应用中的性能。例如利用UL Procyon的测试套件用来评估2D图像处理能力以及视频编解码性能,Cinebench系列、V-Ray和Blender这样的渲染器Benchmark主要用于评估Offline 3D Rendering的性能表现。SPECViewperf 2020 v3.1中包含的多个3D Model/CAD/CAM软件,则主要考察Real-time 3D Rendering的性能。
为了更全面的观察锐龙 7 9700X的性能表现,我们在测试中使用了关闭PBO和开启PBO的两种设置。另外考虑Core i7-14700K在规格上多出了12个E-Core,我们也在部分多线程敏感型应用中,加入了关闭所有E-Core后的测试数据。
Peazip是一款开源的免费文件压缩/解压缩软件,其的内置Benchmark能够很方便的来测试产品在文件压缩场景下的性能。锐龙 7 9700X在单线程模式下赢得非常干脆,领先i7-14700K超过30%!但很奇怪在多线程模式下却输给了对手,即使同样8核心的情况下也没能翻盘。这种情况可能更多的与软件本身的多线程优化相关。
UL Procyon可以看作是著名的整机测试软件PCMark的继任者,但在功能和场景应用上相比PCMark系列更贴近实际的应用情况。这里我们使用了图片编辑(使用Lightroom对照片进行批处理,以及Photoshop对图片进行多重图层编辑应用),视频编辑(使用Premiere Pro对视频进行调整编辑以及特效应用,并最后进行编码输出)两个负载较重的模块进行测试。
结果同样是互有胜负。特别是图像编辑测试中,Photoshop和Lightroom的情况截然相反。锐龙 7 9700X在Photoshop中落后竞品约15.0%,但使用Lightroom执行批处理的操作时,却能领先约16.2%。
在评估CPU在重负载场景下的性能时,基于渲染器的Benchmark通常出镜率很高。这种Offline 3D Rendering能够很好的衡量CPU在并发计算场景下的性能。这里选择了比较有代表性的4款:Cinebench R23和更新的2024版,还有市占率最高的商业渲染器V-Ray,和开源渲染软件Blender。
几乎所有的渲染器Benchmark的结果都是一致的。锐龙 7 9700X在单线程性能上战胜了i7-14700K,考虑到后者单核睿频的频率更高,Zen 5架构的效率优势由此可见一斑。多线程下,i7-14700K那12个E-Core发挥了“重要”作用。如果关掉E-Core,开启PBO的锐龙 7 9700X在同样核心线程数量的比拼下,赢下了所有的测试项目,平均领先幅度约7.2%。
CPU在渲染器中的性能通常只能决定项目完成的时间,对于3D Model/CAD/CAM从业人员来说,在3Ds MAX/Maya/Solidworks软件中的Real-time 3D Rendering性能表现与实际使用体验可能更为休戚相关。
Real-time 3D Rendering逻辑计算占据更主要的部分,并发运算较少,几乎很难把CPU跑到满载。因此一直以来都是AMD的弱项。锐龙 7 9700X在该项目里与i7-14700K互有胜负,但无论输赢,差异均在毫厘之间,大多数甚至可以算是测试误差范围之内。可以说AMD终于补齐了自身的短板。特别是考虑到锐龙 7 9700X功耗优势,这意味着传统的ProViz用户可以用低得多的系统组建成本,实现等同Intel平台的使用体验。
我们使用2款典型的CPU Bound游戏来测试锐龙 7 9700X的游戏性能,设置上默认所有游戏均设定为1920×1080渲染分辨率,画质均开至最高,同时关闭抗锯齿等选项以屏蔽GPU的性能瓶颈可能导致的影响。考虑到游戏体验本身更追求性能的最大化,因此这里我们将只测试锐龙 7 9700X PBO On和Core i7-14700K全核开启的情况。
在线FPS游戏对帧率的敏感度最高。锐龙 7 9700X在CS2和Valorant游戏中分别领先了2.7%和7.8%。
提供前所未有性能表现的同时,Zen 5架构还在工艺上从TSMC 5nm升级到了4nm,由此带来了更为出色能耗表现:PBO关闭状态下,锐龙 7 9700X的满载功耗竟然只有88W,压测15分钟后,平均温度为52.7℃。开启PBO后,满载功耗会大幅增加到约135W,此时温度也会增加至约84摄氏度。虽然看起来开启PBO的增幅相当惊人,但如果看看隔壁Core i7 14700K动辄300W量级的满载功耗,锐龙 7 9700X仅用不到一半的功耗就实现了持平甚至更好的性能,真可谓是“节能”典范。
拥有更低PBO on和off功耗的锐龙 7 9700X,甚至可为升级用户提供散热向下兼容的可能,甚至无惧散热器老化,仅更换处理器就能解决新处理器的全部问题。当然,在换上新处理器之前,别忘了先将主板的BIOS升级至1200A PatchA或更新的版本,毕竟不是所有主板,都具有ROG主板产品那样,在CPU失效情况下,仍能通过闪存盘自动升级BIOS。
而对于新装机消费者,虽然处理器本身并不带有散热器,但是AMD推出了赠送“瓦尔基里R125《七日世界》联名款旗舰风冷散热器”的首发促销。没有赶上促销的消费者也不用遗憾,AMD经典的Wraith Stealth和Wraith Prism风冷散热器都具有镇压65W的能力,而它们的价格只要80元左右,对荷包非常友好。
纵观所有测试,Zen 5架构在锐龙 7 9700X充分实现了设计目标,在单线程上的性能已经基本持平,甚至在浮点计算占比高的应用中实现了对老对手的超越。但也能看到,由于竞品中E-Core的存在,使得相同定位的产品,锐龙 7 9700X在多线程上相较i7-14700K还存在一定差距。另外从测试中的PBO对性能的影响来看,锐龙 7 9700X的65W功耗设定显然较为保守,如果开放到更高功耗,显然还能有更充分的性能释放。
老对手目前正处于多事之秋,前代产品的的故障阴霾还在不断地发酵。在这个时刻,AMD交出Zen 5这样一份令人满意的答卷,显然会对市场份额有着显著的积极意义。从这点上看,赢得DIY市场恐怕只是个开始,OEM市场迎来一段蜜月时光,才是更大的成功。
回到锐龙 7 9700X这颗“7”本身,它以更低的价格和更低的功耗,在绝大多数应用体验上与对手持平或相当幅度的领先,这对于一颗定位于性能级的产品来说,堪称六边形战士了。