显卡世界巅峰对决,RDNA4和布莱克威尔谁是武林盟主?

小虫评数码 2025-03-20 18:20:43
前言

显卡世界每年都要举行武林大会,选取新一任的领袖。表面看,是英伟达、AMD、英特尔三国演义,实际上双雄争霸,英特尔只能充当配角。表面看是双雄争霸,实际是英伟达独孤求败。在2019年7月以前,AMD连上台的资格都没有,到了RDNA(一代)架构,也仅能算个陪练。然而,AMD勤奋苦练,仅五年多时间,RDNA就从第一代进化了到了RDNA4,它能将英伟达斩于马下吗?

正文

在显卡世界,谁的能效比高,谁就是武林盟主。为啥?衡量显卡是否优秀,如果只能选一个指标,那一定是“能效比”,因为该指标是制程、架构和驱动全面优秀的综合表现。比值越高,通常意味着制程更先进,架构更优秀,驱动更澎湃,三者皆优,就能称霸显卡世界,同样的性能,可以卖更高的价格。

此次比武,英伟达派出了布莱克威尔,对应RTX50系列,AMD出场的是RDNA4,对应RX90系列。

布莱克威尔是谁?

从2006年开始,英伟达的显卡架构用科学家名字(姓氏)命名,第一个是 Tesla(特斯拉),后来有:费米、开普勒、麦克斯韦、帕斯卡、伏特、图灵(RTX20)、安培(RTX30)、赫柏,阿达・洛芙莱斯(RTX40), RTX50 系列的 GPU 架构命名为Blackwell,是为了纪念美国数学家和统计学家大卫・布莱克威尔(David Blackwell)。他在博弈论、统计学和概率论领域有开创性贡献。据传,下一代的RTX60系列为鲁宾(Vera Rubin,美国天体物理学家)架构。英伟达的这种命名方法,既传承了科学精神,也强化了品牌的技术和文化内涵,相当高明。

RTX50显卡发布会

RTX50系列和RX90系列哪个制程更优?

早期的半导体制程用栅极宽度来描述,数字越小,制程越先进。例如:7纳米就比10纳米制程更好。既然消费者都这样认为,各厂家开始玩一些数字游戏,以至于现在的制程数值不能反映真实水平。台积电营销负责人曾说,从0.35微米(350nm)开始,所谓的工艺数字就不再真正代表物理尺度了,多少nm仅是一种行业标准化术语而已。更直白地说,这个数字现在主要为营销服务,A厂家的10nm可能比B厂家的7nm更先进。

针对这种行业乱象,英特尔建议以晶体管密度(MTr/mm2,每平方毫米的百万晶体管数)来作为定义工艺节点的指标。

Blackwell架构

对比:

RTX 5080采用TSMC 4N NVIDIA定制工艺,实质是5nm工艺,456亿个晶体管,核心面积378平方毫米,相当于每平方毫米有1.2亿个晶体管。

RX 9070 XT 采用TSMC N4P 工艺,是4nm工艺,晶体管数量539亿,核心面积357平方毫米,相当于每平方毫米有1.5亿个晶体管。

公式:密度 = 晶体管总数量 / GPU芯片面积

GPU内包含复杂结构,此公式仅能算出晶片的平均密度,并不能体现核心功能区域“逻辑晶体管”的密度,这个指标没有公开。

不过,从二者的平均密度看,RTX50还是有较大差距,仗还没有开打,英伟达就在气势上先输一阵。

RDNA4架构

能效比计算

随着GPU越来越强,以前经典的Time Spy(下文简称:TS)开始显得苍老,跑不出高端GPU应该有的差距。在现实生活中,这好比考题简单,无法体现学霸的差异。为此,3DMARK公司推出了压力更大的Steel Nomad(下文简称:SN)来取代TS,体现4K分辨率下的传统渲染能力。又推出了Speed Way测试(下文简称:SW),融合了光线追踪和传统渲染。经过站长测算,超过RTX5070Ti这个性能的显卡,如果采用TS对比,差距偏小。

能效比是一条曲线,即便是同样的制程、同样的架构和驱动,在不同规模和功耗下,其比值是变化的。

站长选取的研究对象如下——

英伟达显卡性能和功耗列表

能效比值的计算

用传统TS分数除以功耗,即得到能效比值。但是,RTX5070Ti以上的型号怎么办呢?站长发明了一个新词语:TS等效分。

我们以RTX3070为基准来计算TS等效分,公式如下:

TS等效分=(SN分/3162)*13550

这样,我们就能用SN分的差异来换算成理想的TS。

TS能效等效比值=TS等效分/实测满载平均功耗

按TS等效分计算的能效比,称为:TS等效能效比值。有点拗口,这样做的好处是让全体参赛选手处于公平地位,不会因为衡量标准发生变动而导致“跨代对比偏差”。

AMD显卡性能和功耗列表

英伟达和AMD能效比最大值分别是RTX5080和RX 9070

用【SN分数/满载平均功耗】对比如下——

RTX5080:8151/328=24.9

RX 9070:6059/245=24.7

用【SW分数/满载平均功耗】对比如下——

RTX5080:8933/328=27.2

RX 9070:6379/ 245=23.7

由以上分析,我们可得两个结论——

1、传统渲染的能效比,二者打成平手。

2、高负载的光追能效比,RTX50系列领先对手约15%。

极速空间显卡能效比天梯图V3.0

上图仅反映传统渲染的能效比,如需高清图,可到极速空间官网下载。

解读

1、英伟达的能效比最高型号是RTX5080,AMD的能效比最高型号是暂时RX9070。由于RX 9080 还未上市,目前还不清楚这是否是RDNA4能效比的天花板。

2、在制程落后的情况下,RTX50还能和RX90在传统渲染能效比打平,光追能效比领先,GDDR7显存功不可没,相比GDDR6显存,GDDR7具备更大的带宽,显存的能效比提升20%。

3、在微架构上,英伟达的布莱克威尔仍然领先。关于这点如何判断,站长后期再讲。

结束语

2025年显卡世界的武林盟主仍然是英伟达,但AMD这几年的进步非常明显,RDNA4首次在传统渲染能效比追平了英伟达,从天梯图上就能看出,在GCN年代的每一步都比较小,到了RDNA后就一路狂奔,这样的进步让消费者惊喜,让对手焦虑。虽然在光追上还欠火候,在驱动上还需要打磨,但RDNA4已经撼动了英伟达独孤求败的地位。

0 阅读:0
小虫评数码

小虫评数码

感谢大家的关注