影驰RTX5070Ti金属大师白金版OC显卡评测:新一代4K游戏甜品卡

IT之家 2025-02-20 23:16:46

自从英伟达推出GeForceRTX4070Ti显卡以来,70Ti/TiSUPER就成了最适合主流玩家体验4K游戏的“甜品卡”,借助DLSS技术和架构优势,能够满足玩家的4K高帧游戏需求,因此也成了玩家们的心头好。

这次的RTX50系列加入了更为强大的DLSS4技术,可以让光追游戏在4K这样的超高分辨率下实现性能飞跃。今天我们就借影驰GeForceRTX5070Ti金属大师白金版OC显卡的测试体验,看看DLSS4技术在70Ti显卡上能够发挥出怎样的性能实力。

为了发挥显卡的全部性能,本次我们搭建了如上图所示的硬件测试平台。

一、外观设计

影驰GeForceRTX5070Ti金属大师白金版OC显卡这次采用了全新设计风格,一改金属大师系列硬朗的直角造型,将四角做成了大弧度的圆角,视觉上更加柔和。

在配色上,“白金”二字通过纯白金属装甲外壳与银白不规则装饰纹理的搭配展现得恰到好处,既保留了硬核风格,又增添了一丝清新感。

金属装甲的白色和风扇略有色差,赋予视觉层次感的同时,也更显高级和霸气。3个直径90mm的白色静霜风扇延续了经典的多段弯折设计,可以带来更大的风量、风压和更小风阻,扇叶数量改为了7叶。

翻到显卡背板,影驰GeForceRTX5070Ti金属大师白金版OC显卡又设计得十分张扬,背板中间位置印又全大写的METALTOP标志和GEFORCERTXLogo。METALTOP标志代表了影驰对于金属工艺的追求。大面积类似电路板的黑色线条,则进一步凸显了科技感。官方还在最左侧特意标出了I/O接口面板对应的HDMI接口位置,方便用户盲插。

尺寸方面,影驰GeForceRTX5070Ti金属大师白金版OC显卡的三围分别是316.5*139*50mm(含挡板),裸卡重量约1.3kg。

显卡一侧采用半包裹设计,金属外壳印有GEFORCERTX和GALAX标志,上方散热鳍片外露,居中为反扣式12V-2*6供电接口,搭配独立背板开槽,便于插拔。

显卡另一侧还能看到置于金手指上方的一条显卡强化支架,金手指采用了全新的PCIe5.0规格。

I/O接口面板还是一如既往的影驰风格,设计了3组不规则的“鳞片”开孔,接口规格则是3个DP2.1b接口+1个HDMI2.1b接口。

配件同样给到了白色套件,包含一根12v-2x6转3*8pin的编制线材转接线,一套可拆卸的金属显卡支架。

二、技术解析

Blackwell架构

之前我们在RTX5090D和RTX5080显卡的评测中已经详细分析了新显卡的Blackwell架构和技术优势,简单来说加入了神经网络渲染的特性,让Blackwell的多单元流处理器(SM)具有更高的处理吞吐量;而为了满足DLSS多帧生成的稳定性需求,Blackwell也支持了FlipMetering来代替CPUPacing,让GPU更精准管理显示时间,尽可能达到每帧的画面生成时间保持一致,从而提升游戏的流畅性。

第五代Tensor核心

第五代Tensor核心能够加速重新排序,并新增了对FP4精度模型的支持,相较于第四代Tensor核心上所支持的FP8精度模型,吞吐量提升2倍;相比FP16精度模型,FP4的显存使用不到一半,GPU性能的提升却高达2倍。正是由于第五代Tensor核心的加入,才让DLSS4技术能够顺利支持多帧生成功能。

第四代RT核心

在RTCore方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代Blackwell架构下光线、路径与三角形相交的检测效率为上一代的2倍,初代使用RTCore的Turing架构的8倍,并增强了压缩以减少内存占用,相比上代的显存使用率节省了25%,光线追踪效果也得到了前所未有的细节提升。

配备GDDR7显存

除了技术上的提升,Blackwell架构的GPU还搭载了GDDR7显存。GDDR7采用的是PAM3信号编码机制,与GDDR6和GDDR6X有所区别。PAM3每两周期的数据传输为3位,相比GDDR6和GDDR6X更省电,带宽也进一步提升,速度高达30Gbps。

RTX5070Ti规格

具体到产品规格上,影驰GeForceRTX5070Ti金属大师白金版OC显卡基于最新一代GB203-300核心和TSMC4N架构制程工艺打造,包含8960个CUDA核心、1406个Tensor核心、133个光追核心。

影驰GeForceRTX5070Ti金属大师白金版OC显卡的核心频率工作范围是2300MHz-2497MHz,显存方面升级为256-bit显存位宽的16GBGDDR7规格,带宽来到了896GB/s。TDP功耗为300W,相比上代RTX4070Ti增加了15W。

三、理论跑分

先看烤机,我们用这套配置搭配RTX4070TiSUPER显卡进行20分钟的单烤甜甜圈,GPU的核心温度稳定在66.8℃左右,GPU功耗为285W,工作频率保持在2560MHz左右。

单烤甜甜圈20分钟后,影驰GeForceRTX5070Ti金属大师白金版OC显卡的功耗稳定在300W,GPU核心温度69.2℃,工作频率温度在2600MHz左右,两者差别不大,主要是烤机功耗上相差了15W。

在3DMarkTimeSpyDX12测试中,影驰GeForceRTX5070Ti金属大师白金版OC显卡分达到了27813分,对比RTX4070TiSUPER的23715分,提升幅度约17.2%。

在3DMarkTimeSpyExtremeDX12测试中,影驰GeForceRTX5070Ti金属大师白金版OC显卡得分达到了13598分,对比RTX4070TiSUPER的11776分,提升幅度约15.4%。

在3DMarkPortalRoyal实时光追测试中,影驰GeForceRTX5070Ti金属大师白金版OC显卡的综合分为18990分,对比RTX4070TiSUPER的15697分,提升幅度达到了20.9%。

上面3项测试结果表面,影驰GeForceRTX5070Ti金属大师白金版OC显卡相较于RTX4070TiSUPER的理论图形性能提升幅度在15%-20%,而RTX4070TiSUPER相比RTX4070Ti平均提升约6%左右,所以相比上代显卡的提升幅度在20%以上。

四、游戏实测

由于DLSS4技术是RTX50系显卡的独占,所以游戏测试部分依旧分未支持DLSS4的游戏和支持DLSS4的游戏两部分。

1、《CS2》

首先是2款在线竞技游戏,在《CS2》中:

RTX5070Ti在4K分辨率+高画质下,游戏平均帧数为258帧,1%Low帧99帧,平均延迟11ms;

RTX4070TiSUPER在4K分辨率+高画质下,游戏平均帧数为217帧,1%Low帧89帧,平均延迟13ms;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约18.8%,1%Low帧提升12.3%,平均延迟降低18.2%。

RTX5070Ti在2K分辨率+高画质下,游戏平均帧数为447帧,1%Low帧162帧,平均延迟8ms;

RTX4070TiSUPER在2K分辨率+高画质下,游戏平均帧数为404帧,1%Low帧151帧,平均延迟10ms;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约10.6%,1%Low帧提升7.2%,平均延迟降低25%。

2、《永劫无间》

《永劫无间》这款游戏一直都非常积极于DLSS技术的适配,NVIDIA官方还透露后续将与这款游戏合作,推出NVIDIAACE技术的AI队友更新,经过实测:

RTX5070Ti在4K分辨率+最高画质+DLSS质量下,游戏平均帧数为135帧,1%Low帧89帧,平均延迟32ms;

RTX4070TiSUPER在4K分辨率+最高画质+DLSS质量下,游戏平均帧数为108帧,1%Low帧51帧,平均延迟41ms;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约25%,1%Low帧提升74.5%,平均延迟降低22%。

RTX5070Ti在2K分辨率+最高画质+DLSS质量下,游戏平均帧数为205帧,1%Low帧129帧,平均延迟23ms;

RTX4070TiSUPER在2K分辨率+最高画质+DLSS质量下,游戏平均帧数为168帧,1%Low帧108帧,平均延迟29ms;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约22%,1%Low帧提升19.5%,平均延迟降低21%。

3、《无限暖暖》

《无限暖暖》作为一款上市不到半年的端游,目前在游戏性能上可优化的空间还很大,这款游戏目前也支持了光线追踪和DLSS,经过实测:

RTX5070Ti在4K分辨率+极致画质+开启光追+DLSS抗锯齿下,游戏平均帧数为98帧,1%Low帧84帧;

RTX4070TiSUPER在4K分辨率+极致画质+开启光追+DLSS抗锯齿下,游戏平均帧数为87帧,1%Low帧75帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约12.6%,1%Low帧提升12%。

RTX5070Ti在2K分辨率+极致画质+开启光追+DLSS抗锯齿下,游戏平均帧数为143帧,1%Low帧107帧;

RTX4070TiSUPER在2K分辨率+极致画质+开启光追+DLSS抗锯齿下,游戏平均帧数为129帧,1%Low帧101帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约10.8%,1%Low帧提升5.9%。

4、《古墓丽影:暗影》

《古墓丽影:暗影》只支持初版DLSS,可以看作是传统光栅游戏的代表,经过实测:

RTX5070Ti在4K分辨率+最高画质下,游戏平均帧数为127帧,1%Low帧108帧;

RTX4070TiSUPER在4K分辨率+最高画质下,游戏平均帧数为111帧,1%Low帧98帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约14.4%,1%Low帧提升10.2%。

RTX5070Ti在2K分辨率+最高画质下,游戏平均帧数为236帧,1%Low帧170帧;

RTX4070TiSUPER在2K分辨率+最高画质下,游戏平均帧数为204帧,1%Low帧152帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约15.6%,1%Low帧提升11.8%。

5、《极限竞速:地平线5》

《极限竞速:地平线5》也是游戏测试的常客了,游戏的优化较为出色,经过实测:

RTX5070Ti在4K分辨率+极端画质下,游戏平均帧数为139帧,1%Low帧112帧;

RTX4070TiSUPER在4K分辨率+极端画质下,游戏平均帧数为122帧,1%Low帧101帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约13.9%,1%Low帧提升10.8%。

RTX5070Ti在2K分辨率+极端画质下,游戏平均帧数为194帧,1%Low帧155帧;

RTX4070TiSUPER在2K分辨率+极端画质下,游戏平均帧数为153帧,1%Low帧130帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约26.7%,1%Low帧提升19.2%。

6、《鸣潮》

开放世界冒险游戏《鸣潮》最近也支持了DLSS帧生成功能,原本锁60帧的游戏只需在设置菜单中开启NVIDIADLSS、插帧和超级分辨率的选项,即可解锁4K分辨率+高帧游戏体验。

我们分别测试了关闭与开启光追下的帧数表现:

在4K分辨率+最高画质+DLSS3质量档下,游戏平均帧数为207帧,1%Low帧82帧;

在4K分辨率+最高画质+DLSS3质量档+高档光追下,游戏平均帧数为171帧,1%Low帧70帧;

可以看到,无论是否开启光追,《鸣潮》在4K分辨率+最高画质下都能达到平均160帧以上的帧数表现,平均延迟也被控制在15ms左右,游戏体验非常舒适。虽然开启光追后游戏平均帧数下降了36帧,但1%Low帧反而控制得更好。

7、《黑神话:悟空》

在“众生平等”代表之作《黑神话:悟空》中,开启全景光追后的显卡压力非常大。经过实测:

RTX5070Ti在4K分辨率+影视级画质+50%超采样分辨率+高全景光追+帧生成下,游戏平均帧数为76帧,1%Low帧48帧;

RTX4070TiSUPER在4K分辨率+影视级画质+50%超采样分辨率+高全景光追+帧生成下,游戏平均帧数为66帧,1%Low帧42帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相比RTX4070TiSUPER显卡(默频)的平均帧数提升约15.1%,1%Low帧提升14.2%。

RTX5070Ti在2K分辨率+影视级画质+50%超采样分辨率+高全景光追+帧生成下,游戏平均帧数为114帧,1%Low帧64帧;

RTX4070TiSUPER在2K分辨率+影视级画质+50%超采样分辨率+高全景光追+帧生成下,游戏平均帧数为102帧,1%Low帧59帧;

影驰GeForceRTX5070Ti金属大师白金版OC显卡相较RTX4070TiSUPER显卡(默频)的平均帧数提升约11.7%,1%Low帧提升8.4%。

在常规游戏测试环节,无论是2K还是4K分辨率,无论是否开启光追和DLSS,影驰GeForceRTX5070Ti金属大师白金版OC显卡,相较RTX4070TiSUPER显卡的游戏性能基本都有10%-20%的提升,这个成绩已经可以媲美RTX4080SUPER的性能表现了。

五、DLSS4游戏体验

RTX50系显卡新增的DLSS4技术在DLSS3的技术上,新增了全新的多帧生成技术,结合第五代Tensor核心的强大性能,利用AI为每个渲染帧生成至多3个额外帧,从而大幅提升游戏的FPS水平。

DLSS4配合全套DLSS技术,包括光线重建、超分辨率以及DLAA等功能,最多可实现传统图像渲染的8倍帧率。

多帧生成技术还可配合NVIDIAReflex低延迟技术保持较低的游戏延迟,让游戏的操作和响应影响很小。Blackwell显示引擎也在DLSS4技术发挥了重要作用,通过提升其像素处理能力,让游戏在更高分辨率和刷新率下满足DLSS4技术的要求,最高可提升1倍的像素处理能力。

DLSS4技术还带来了模型架构的重大升级,DLSS光线重建、DLSS超分辨率和DLAA特性均由首个实时Transformer模型驱动,并用来提升生成像素的质量,它支持通过自注意力操作评估整个帧几多个帧中每个像素的重要程度,更好理解场景关系,让生成的像素具有更好稳定性、更少的伪影、更丰富的运动细节和平滑边缘。

官方表示,目前已有超过75款支持DLSS帧生成技术的游戏和应用可在GeForceRTX50系列GPU上升级至DLSS多帧生成技术,不少主流3A大作也已于50系显卡正式发售后更新了DLSS4多帧生成功能的支持,包括《心灵杀手2》、《夺宝奇兵:古老之圈》、《黑神话:悟空》、《星球大战:亡命之徒》《寂静岭2:重制版》等热门作品。

《赛博朋克:2077》作为首批支持DLSS4技术最完善的游戏之一,如果在4K分辨率下开启光追,但不开启DLSS和帧生成选项,那么:

在4K分辨率超级光追画质下,游戏平均帧数为29帧;

在4K分辨率超速光追画质下,游戏平均帧数为14帧;

这样的表现基本就告别游戏体验了,可见这款游戏在4K分辨率+光线追踪设置下,对于显卡物理图形性能的压力非常大。

即使选择4K分辨率+超级画质,不开光追和DLSS,游戏平均帧数也才59帧,属于勉强及格的水平。

不过,当我们开启DLSSMultiFrameGeneration(DLSS多帧生成)选项后,游戏帧数的表现瞬间就不一样了。我们依次在4K分辨率+超级光追画质+DLSS质量设置下,选择2x、3x和4x多帧生成,运行游戏基准测试,分别得到了120帧、167帧和206帧的游戏平均帧数,相比不开DLSS时的29帧,提升幅度分别达到了4.1倍,5.7倍和7.1倍,真的相当恐怖,顶着4K分辨率+最高画质,几乎可以跑满4K/160Hz显示器规格的《赛博朋克:2077》,便是DLSS4技术的实力。

接着,我们再来看下另一款支持DLSS4的游戏《心灵杀手2》表现如何。游戏在4K分辨率+原生最高画质下,平均帧数也只有39帧,相比《赛博朋克:2077》的压力可谓是更胜一筹。另外,大家注意此时的游戏平均延迟是66ms。

而在开启了Ultra等级的光追和路径光追下,除了帧数表现非常不给力外,高达123ms和203ms的游戏平均延迟,游戏体验注定好不了。

而在游戏中开启DLSS4的多帧生成选项后,4K分辨率+路径光追下,2x、3x和4x多帧生成时的游戏平均帧数分别提升到了73帧、104帧和133帧,相比不开启DLSS时的游戏平均帧数提升幅度分别为5.2倍,7.4倍和9.5倍,1%Low帧也都过了60帧的及格线,足见DLSS4的强悍实力。

与此同时,虽然在开启DLSS4后,游戏延迟没有恢复到原生最高画质的66ms左右,依旧要高出至少14ms,但每级多帧生成倍数下游戏平均延迟只增加了4ms。

那么多帧生成会影响画质吗?通俗点说就是会不会令画面变得更糊?为此我们也在《心灵杀手2》中同一个场景截取了3种不同画质设置的游戏画面,分别是:

4K原生画质+路径光追;

4K最高画质+DLSS性能档(1080P渲染)+4x帧生成

4K最高画质+DLAA(4K渲染)+4x帧生成

然后通过NVIDIAICAT工具进行比较,在不放大的情况下3者根本看不出区别,所以我们挑选了3处细节进行放大对比。

首先是警员手臂衣服上的FBI标志,左侧和右侧分别是DLAA(4K渲染)和原生4K画质,中间是DLSS性能(1080P渲染),经过放大可以看到中间图片的FB文字更糊一点,但左右基本看不出清晰度上的区别。

同样在警员的波浪卷发以及身旁右侧的树叶上也能看出中间的画面更糊一点,左右两边的图片却难以发现差距。

也就是说对于物理渲染分辨率上的天然鸿沟,DLSS技术肯定是无法完全弥补画质差距的,但只要保持和原生画质相同的分辨率(即开启DLAA),画面清晰度和细节几乎没有区别,更别说我们这种“盯帧式”比较有点吹毛求疵,正常游戏无论是DLSS性能档(1080P渲染)还是DLAA(4K渲染)都不会有糊成一片,锯齿满满这种明显问题,所以最主要的还是看游戏适配,在乎画质的小伙伴直接开启DLAA就好了。

六、创意生产

生产力方面,IT之家实测了ULProcyon的图像视频剪辑、以及AI文本撰写等性能。

在ULProcyon的视频剪辑性能测试项目中,GPU加速,得益于Blackwell架构升级的第九代NVENC编码器和NVDEC解码器,其在H.264/H.2654:2:2编码的8位和10位视频上有着非常大的优势,经过实测:

影驰GeForceRTX5070Ti金属大师白金版OC显卡得分62657分;

GeForceRTX4070TiSUPER显卡得分55763分;

影驰GeForceRTX5070Ti金属大师白金版OC显卡视频编辑性能相较RTX4070TiSUPER提升约12.3%。

在ULProcyonAI推理性能测试项目中的MicrosoftWindowsML版本测试中:

影驰GeForceRTX5070Ti金属大师白金版OC显卡得分1340分;

GeForceRTX4070TiSUPER显卡得分1230分;

影驰GeForceRTX5070Ti金属大师白金版OC显卡的MicrosoftWindowsML版本AI推理性能提升相较RTX4070TiSUPER约8.9%。

在侧重建模和渲染性能的blenderBenchmark4.3.0版本基准测试中:

影驰GeForceRTX5070Ti金属大师白金版OC显卡的3个场景分别拿到了3611分、1959分、1911分;

GeForceRTX4070TiSUPER显卡的3个场景分别拿到了3503分,1712分、1800分;

在Blender基准测试的3场景渲染中,影驰GeForceRTX5070Ti金属大师白金版OC显卡的渲染性能相较RTX4070TiSUPER提升分别约为3%、14.4%、6.1%。

七、总结

综合来看,本次RTX5070Ti的游戏性能非常符合4K游戏甜品卡的定位,它相较于RTX4070TiSUPER显卡的提升幅度约10%-30%,游戏性能可以媲美RTX4080SUPER,更有DLSS4技术加持所带来的成倍性能提升,可以说是专门为PC玩家所准备的。

同时,DLSS4技术的成功也奠定了未来显卡性能的升级方向,即只渲染关键帧,过渡帧可通过AI补帧来填充,以最佳的性能表现呈现给玩家;光追游戏的开发者也能更好施展拳脚,优化更加轻松,RTX5070Ti也是一张适合“战未来”的显卡。

而在设计上,影驰GeForceRTX5070Ti金属大师白金版OC显卡的颜值没得说,纯白外壳+无光污染+圆角设计,相信会成为不少纯色系装机玩家心目中的“白月光”。

0 阅读:1