技嘉AORUSGeForceRTX4070MASTER12G评测,依旧堆料依旧适合2K游戏

IT之家 2023-04-14 09:09:44

在之前 RTX 4070Ti 显卡的评测中,我们提到过它适合 2K 分辨率下的极致游戏体验。如今 RTX 4070 也正式发布了,相比 RTX 4070Ti 它的实际游戏体验又如何呢?本次我们就以手上这张技嘉 AORUS GeForce RTX 4070 MASTER 12G 显卡为例,来看看 RTX 4070 的表现吧。

技嘉 RTX 4070 超级雕属于比较堆料的一张卡,整体卡身为深灰色调,因此我们这次搭配了黑色机箱,让它看起来更有电竞属性。本次测试中,IT之家将搭配以下硬件用作测试平台,确保测试时不会出现性能瓶颈。

不知大家有没有发现,这次我们采用了技嘉在去年发布的一款基于 ATX 3.0 规范的千瓦电源 —— 技嘉 UD 1000GM,这款显卡最大的亮点就是自带 12VHPWR 供电线,最高支持 600W 供电,从而让高端显卡设备比如 RTX3090Ti 无需再使用 12VHPWR 转 8Pin*3 的转接线,降低装机理线难度的同时,还降低了电脑出现故障的风险概率,可谓是一举多得,希望其他电源厂商能够尽快跟进吧。

外观设计

技嘉 RTX 4070 超级雕是一张三槽三风扇的显卡,就目前来说主流的 ATX 机箱放进它问题都不大。整体的造型非常硬朗,整个卡身包裹着银灰色材质的金属装甲。

显卡正面部分,技嘉这次采用了 2 大设计,分别是 RGB 炫彩光轮和风之力散热系统。所谓炫彩光轮指的是,技嘉在三个全新设计的 108mm 仿生鲨鱼风扇的金属外壳包裹边缘设计了三环灯效,在亮机后风扇本体并不发光,但是光轮部分会呈现出三色 RGB 渐变色混光。

当然你可以在技嘉的光效调节软件中设置多达 12 种不同的 RGB 效果,也支持自定义专属颜色。同时在显卡的侧面和背面都各有一个支持 RGB 背光的大写 AORUS 装饰灯,确保用户无论是横竖装卡都能拥有夺目的 RGB 效果。

风之力散热系统说的则是整个显卡的散热设计,比如三枚风扇支持 3D 启停,正逆转设计,内部均热板直接接触 GPU,9 根复合式热管等等。

在显卡的一侧技嘉也提供了双 BIOS 模式开关,方便用户快速切换性能模式,不需要强性能但追求安静是可以将其拨到静音模式减少噪音,模式切换后需要重启电脑生效,出厂默认预设则是满血的 OC 性能模式。

显卡背板同样采用了金属材质,右侧占据一半面积的进气格栅可以快速将热量排出显卡,提高散热效能,让显卡的性能稳定性更高。

包装内这次附赠了基于显卡尺寸和造型定制的显卡支架,可以在装机时给予卡身更好的支撑,避免压弯主板或由此导致的变形问题。

接口方面,技嘉 RTX 4070 超级雕与公版保持一致,都是最新的 16pin 供电接口,包装内还附赠了 2*8Pin 转 16Pin 的转换头,以及雕头贴纸。

核心解析

‏RTX 4070 的核心与 RTX 4070Ti 一样是‏‏基于 AD10‏‏4 核心所打造的,‏‏里面有 4 组满血的 GPC,‏‏内‏‏部共‏‏有 5888 个 CUDA 核心、‏‏184‏‏个 Tensor 核心、46 个第三代 RT 核心和 64 个 ROP 单元‏‏,‏‏另外,NVENC 视频编码单元相比 4070Ti 少了一个,NVDEC 视频解码单元依旧保留。

技嘉 RTX 4070 超级雕的‏‏核心频率是 1920MHz,‏‏Boost 频率 2495MHz。‏‏显存方面‏‏则是 192‏‏-bit‏‏位宽的 12‏‏GB GDDR6X‏‏,显存频率高达 21000MHz。从上述定位中我们可以看出,RTX 4070 是一张定位 2K 高帧率游戏的中高端显卡。

RTX 4070 同样基于最新款的 NVIDIA Ada 架构打造‏‏,它‏‏升级到了‏‏TSMC 4N NVIDIA 定制工艺,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器‏‏的‏‏吞吐量超过上一代产品 2 倍。第三代 RT Cores 的有效光线追踪计算能力是上一代产品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。

反映到具象的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。同时支持双 AV1 编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。

理论性能

接下来我们进行理论性能测试环节。‏‏首先是双烤,烤机 15 分钟后,核心温度稳定在‏‏71‏‏℃左右,功耗稳定在 187‏‏W 左右,‏‏这个功耗控制得很不错,而且此时风扇仅工作了 65%,所以噪音控制得也很不错,游戏时很安静。

‏接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测技嘉 RTX 4070 超级雕‏‏的得分为 99.6%,性能释放极其出色。

在 3DMark TimeSpy DX12 测试中,显卡分数‏‏相比 RTX 3080 12GB 的 18793 分基本持平,默频成绩‏‏达到了 18880 分,作为对比 RTX 3090 为 20501 分。‏‏可以看出技嘉 RTX 4070 超级雕的 DX12 分数在驱动更新后已经和 RTX3080 12G 处于同一水平了。

在 3DMark Fire Strike DX11 测试中,‏‏由于传统的 FireStrike 已经无法满足高端显卡的需要,因此我们只测试了压力更大的 FireStrike Extreme,技嘉 RTX 4070 超级雕的显卡分数达到了‏‏21599 分,作为对比 GeForce RTX3080 12G 分数为‏‏22781 分‏‏。

而‏‏在 3DMark Portal Royal 光追测试中,技嘉 RTX 4070 超级雕获得了‏‏11579‏‏分,‏‏而 RTX 3080 12GB 的分数为 12157 分,可能是显存大小和显存位宽的劣势带来的光追性能的差距,导致跑分略逊于 RTX 3080 12G 几百分。不过反映到实际游戏中,差距不会太大。

‏游戏实测

‏接下来,我们就进行一下游戏实测,所有游戏我们就在 2K 分辨率最高特效下进行测试,有 DLSS 就开启平衡档 DLSS,有 DLSS3 我们则会分别测试打开关闭前后的帧数。首先是电竞游戏,我们选取了《CS:GO》这款主流的 FPS 游戏进行测试。运行 CS:GO 中自带的 BenchMark,平均帧达到了 489 帧,可以满足电竞显示器高帧畅玩的需求。

值得一提的是,目前十大竞技射击游戏中已有八款支持 NVIDIA Reflex,包括《Apex 英雄》、 《使命召唤: 战区 2》、《命运 2》、《逃离塔科夫》、《堡垒之夜》、《守望先锋:归来》、《彩虹六号:围攻》和《无畏契约》,开启 NVIDIA Reflex 后可以帮助玩家在保证高画质和高帧率的同时,也能拥有最低的延迟表现,后面的评测中我会详细提到。

接下来是两款 3A 大作,在《古墓丽影:暗影》中,技嘉 RTX 4070 超级雕在 2K 分辨率最高画质下,帧数可以跑到平均 176 帧,作为对比 RTX 3070Ti 可以跑到 142 帧;而打开 DLSS2 质量档后,帧数进一步提升至 208 帧,作为对比 RTX 3070Ti 可以跑到 165 帧。

而在《荒野大镖客 2:救赎》中,2K 分辨率最高画质的平均帧为 108,作为对比 RTX 3070Ti 可以跑到 90 帧;开启 DLSS 质量档后,也可以在 2K 最高画质下运行在平均 122 帧,作为对比 RTX 3070Ti 可以跑到 90 帧,流畅游玩不成问题。

以上这些帧数都是在 DLSS2 基础上实现的,但 RTX40 系列显卡最吸引人的地方,还是 DLSS 3 技术。‏‏DLSS 3 是一款由 AI 驱动的性能倍增‏‏技术‏‏,由全新第四代 Tensor Core 和 GeForce RTX40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。

简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升‏‏4 倍!

就目前来说,首发支持 DLSS 3 的游戏已有 30 款,以后的新游戏势必也会第一时间支持 DLSS 3,并且总数还在按月为时间单位增加,如果算上所有支持 DLSS 的游戏和应用,那么这个数量就一下子来到了 280 余款。

我们先看最吃配置的代表游戏‏‏《赛博朋克:2077》‏‏,‏‏在‏‏2‏‏K 最高画质超级光追下运行它自带的 BenchMark‏‏,可以看出在默认状态下没法稳定 60 帧,如果开启质量档的 DLSS2,就可以达到 60 + 帧的畅玩线了。如果在 DLSS3 选项全开的情况下,至多可以实现帧数 3 倍的提升。相比于同档位的 DLSS 2,帧数提升了 35 帧,提升幅度不小。

《巫师 3》作为一款非常经典的老 3A,自从最近更新了次世代版,配置要求也大大提高,好在它提供了 DLSS 3 技术的支持,虽然在默认情况下还是无法 60 帧流畅运行,但是开启 DLSS2 质量档后,57 帧的平均帧数总算摸到了 60 帧的边,适当降低一点画质应该问题不大。而在同时开启 DLSS3 之后,平均 88 帧的表现玩起来就毫无压力了。

最后我们再来测试一款画质表现非常出色的次世代 3A 大作《瘟疫传说:安魂曲》,这款游戏的优化比较出色,而且首发就支持了 DLSS 3 技术。

当然,圈子里也流行‏‏DLSS 3‏‏会导致延迟增加,打游戏不跟手的说法。的确,DLSS 3‏‏的本质是 AI 生成全新帧,生成帧‏‏是需要一个时间的,‏‏这个延迟的提高对于竞技游戏的影响是很大的‏‏,但目前支持 DLSS 3 的游戏都是不吃输入延迟的 RPG 游戏。并且‏‏在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。‏‏我们以《瘟疫传说:安魂曲》为例,开启 DLSS 3 + NVIDIA Reflex 后延迟仅增加了几毫秒,这对于游戏体验是没有影响的。但如果把 DLSS 和 NVIDIA Reflex 都关闭的话,虽然延迟下降明显,但帧数和流畅度方面的折扣也比较大。

最后,我们也统计了一下几款游戏的实际功耗表现,可以看到最优秀的荒野大镖客 2 实际功耗只有 177 瓦,所有游戏的功耗也都低于 200 瓦,这个表现已经低于 RTX 3070Ti 了,这当然离不开全新 ADA 架构中的 SM 多单元流处理器,它在提升 2 倍性能的同时,还能做到降低功耗,所以说 RTX 4070 对于 2K 游戏的契合度绝不只是性能,功耗也是。

创意生产

‏得益于 12G 大显存和强大的 CUDA 核心,RTX 4070 不仅可以用来游戏,拿来进行创意生产也不在话下。技嘉 RTX 4070 超级雕拥有 5888 个强大的 CUDA 核心,在应对创意生产和深度学习方面会有一定建树。同时,它‏‏也‏‏可以安装‏‏NVIDIA Studio 驱动,‏‏有超过 75 款创意应用‏‏都‏‏可以调用‏‏NVIDIA CUDA 核心的‏‏AI 算力,大大提高了工作效率。

在建模渲染类软件中,‏‏5888 个‏‏CUDA‏‏核心可以‏‏为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。

在‏‏V-Ray Benchmark‏‏中,技嘉 RTX 4070 超级雕获得了 1874 分,可以顺利应对大部分的建模渲染需求。‏

同样,进行光线追踪建模渲染自然也没问题,‏‏例如技嘉 RTX 4070 超级雕‏在 V-Ray GPU RTX 中的分数也达到了 2639 分‏‏。‏

在常用渲染器工具 Octane 自带的 BenchMark 中,RTX 4070 的渲染能力也是很强的,各项测试中它的渲染能力差不多约等于 4 到 9 张 GTX 980 的算力,进步可以说是显而易见的了。

在主流建模软件 Blender 中,技嘉 RTX 4070 超级雕的表现不错,具体分数如图所示,应付一些复杂的建模工作都不是问题。

在视频后期这一块,技嘉 RTX 4070 超级雕同样‏‏配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能‏‏。‏

AV1 成为趋势既是科技进步的结果,也戳中了行业对于生产力需求的痛点,那就是大幅压缩视频文件的体积大小,同时保证画质几乎不受影响。

我们对此也进行了一项简单的测试,通过剪映专业版软件采用 H264 和 AV1 这两种不同的编码导出同一段视频素材。最终 H264 编码的文件大小为 159MB,而 AV1 编码的文件大小只有 127MB,体积缩小了 21%,但是画质基本看不出区别。

另外,英伟达还为 RTX30/40 系显卡引入了 RTX 视频超分辨率技术,全称为 RTX Video Super Resolution。它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,原理有点像游戏中的 DLSS 技术。同时,AI 算力还可以智能锐化和强化物体、人物的特征和边缘,当然它需要占用一定的 GPU 资源用于计算,所以用该技术看视频时最好不要同时玩显卡占用极高的 3A 游戏哦。

↑ 从左至右依次为 1080P 原生画质和 VSR4 超分辨率后的视频画面对比

在创意工作者最常用的非线性编辑软件 Adobe Premiere Pro 中,我们开启 GPU Cuda 加速,然后使用 PugetBenchmark 进行测试。最终得分为 1565 分,这样的成绩可以轻松应对 4K 甚至 8K 的复杂视频剪辑。

而在特效制作软件 Adobe After Effects 中,我们同样使用 PugetBenchmark 进行测试。最终得分为 1655 分,可见 RTX 4070 的创意生产性能非常出色。

总结

经过各项测试后,其实大家已经对这张卡的性能表现有了一定的认识,相比此前发布的 RTX 4070 Ti,RTX 4070 的定位更偏向于 2K 游戏的流畅性能表现,在 NVIDIA DLSS 3 技术的加持下,很多原生 2K 分辨率不可畅玩的游戏,都可以跑到一个较高的游戏帧数,在确保玩家体验的同时,性价比依旧出色。

至于显卡本身,技嘉 RTX 4070 超级雕这张卡的外观设计不仅继承了诸多“雕牌”设计的经典元素,整体风格也更加的时尚炫酷,在 RGB 灯效的运用上不夸张但氛围感给得恰到好处,如果不把它竖起来装实属可惜,总之如果你需求一块可以满足你 2K 游戏性能的显卡,技嘉 RTX 4070 超级雕一定不会让你失望。

0 阅读:49

IT之家

简介:爱科技,爱这里 - 前沿科技人气平台