勇战4K无压力iGameGeForceRTX5070TiVulcanOC16GB评测

啊鲁 2025-02-21 19:36:29

前言:

从GeForce RTX 5090 D~80显卡发布后,不少玩家都高呼进化到第四代的大力水手DLSS4真是黑科技,做到了高帧率与高画质兼顾真是让人喜闻乐见。

但旗舰的定位注定不会是普罗大众玩家的首选,相比之下中高端的产品才是叫好又叫座的。而NVIDIA深知这一点,就在昨天推出了价格更为亲民的GeForce RTX 50系列显卡GeForce RTX 5070 Ti。

Blackwell架构亮点:

第5代Tensor Core

与上代Ada的Tensor类似,Blackwell的Tensor核心支持 FP16、BF16、TF32、INT8、INT4以及 Hopper 架构的FP8 Transformer Engine。RTX Blackwell进一步新增对FP4精度格式的Tensor核心运算支持,能更好的满足现阶段AI应用加速和游戏中AI渲染的需求,使AI吞吐量翻倍,内存需求降低50%。并搭载了全新的第二代 FP8 Transformer Engine,这点与数据中心级 Blackwell功能上是一致的,老黄刀法开始收敛了,哈哈。

第4代RT Core

Blackwell架构中的第四代 RT 核心在光线-三角形相交测试方面的吞吐量是 Ada 架构的两倍。说人话就是,实现光线追踪效果更高效,能更好支持神经网络网络渲染技术。

AI运算管理器

它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。

针对神经网络着色重组优化SM

Blackwell使用了新的RT Core和Tensor Core设计,进一步增强了神经渲染能力,性能高达125 TFLOPS。相比于上一代的Ada 架构的SM,Blackwell SM在每个时钟周期内提供了翻倍的整数运算吞吐量,从而有助于提升神经着色至关重要的地址生成工作负载。

新显存GDDR7

Blackwell 架构首次引入了对 GDDR7显存的支持,标志着显存技术的又一次重大飞跃。以下是其核心改进:

编码技术的演进

GDDR6X(RTX 40 系列):升级为 PAM4 编码,每周期传输 2 位数据。

GDDR7:创新性地采用 PAM3 编码,每两周期传输 3 位数据。

性能与能效的双重提升

信号质量优化:PAM3 编码显著降低了信号失真,提升了信号清晰度。

频率与电压优化:GDDR7 能够在更高频率下运行,同时工作电压更低。

效率提升:相比 GDDR6,GDDR7 的数据传输速率提升至 2 倍,而功耗却大幅降低。

更高的显存频率和更低的电压意味着更强的性能和更低的能耗。

这一改进不仅提升了显存带宽,还优化了整体系统的能效表现,为高负载任务(如游戏、AI 计算等)提供了更强大的支持。简而言之,GDDR7通过创新的PAM3编码技术,实现了“既要马儿跑得快,又要马儿吃得少”的目标,为 Blackwell 架构带来了显著的显存效率提升。

Blackwell架构剖析:

GB202芯片微架构图

GeForce RTX 5090和GeForce RTX 5090 D采用GB202核心,拥有922亿个晶体管,采用TSMC 4N工艺,芯片面积达到750mm²,比GeForce RTX 4090的AD102大20%,每平方毫米的晶体管密度高达1.24亿个!正所谓大力出奇迹,这里面的力指的就是科技,正所谓科技是第一生产力!

Blackwell的GPC结构图

从上图能看到,每个TPC包含2个SM,内置128个CUDA Core,1个第四代RT Core,4个第五代Tensor Core,4个纹理单元(Texture Units),1个512KB寄存器文件,128KB L1共享缓存,这些缓存可以根据图形类型以及运算负载需求进行重新分配。

Blackwell的SM架构图

SM单元作为GPU架构中重要构成,在GPU并行处理中起着关键作用,它通过其各种核心(CUDA,Tensor,RT),高效的warp调度,内存管理以及对AI等现代工作负载的支持实现大规模并行运算。

在BlackWell架构的SM单元中,INT32整数运算的数量翻倍。与Ada架构的SM单元相比,实现INT32与FP32内核的完全统一。在时钟周期内,统一内核只能选择FP32或INT32内核运行。

什么是DLSS 4?

DLSS 4采用全新的Transformer模型架构,相较于传统相比卷积神经网络CNN模型,其参数量提升了2倍,同时计算性能提升了4倍。这一进步不仅增强了画质的稳定性,还能提供更多细节,极大地优化了游戏画面的呈现效果。

让引入了多帧生成技术,通过 AI 计算为每个渲染帧额外生成高达3帧!与传统渲染方式相比,它能够最多实现8倍的性能提升。并且每次渲染额外帧只需要AI模型执行一次,就能输出三帧画面,堪称插帧界的PDD!DLSS 4技术在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。

Reflex2低延迟:

该技术融合了Reflex低延迟模式和Frame Warp技术,能够将最新的鼠标输入指令实时同步到渲染帧中。通过及时更新游戏帧并在帧发送到显示器前获取最新的鼠标数据,系统能够刷新渲染帧,从而显著降低延迟。Reflex2与原生渲染相比延迟减少了多达75%,极大地提升了响应速度和游戏体验,目前该技术率先支持RTX 50系列显卡,NVIDIA透露在未来将会对其他RTX系列显卡提供支持。

支持DLSS4的游戏多吗?

在后续的时间里,待RTX 50系列显卡全面铺开之后,支持DLSS 4的游戏将会多达75种,名单如目录如上图所示,据我所知目前《赛博朋克2077》、《霍格沃茨之遗》、《星球杀手:亡命之徒》已经可以体验。

生产力的提升:

Blackwell架构加入了对4:2:2 10bit H.264/H265色度采样视频进行编码和解码的支持,对众多视频创作者来说是喜闻乐见,毕竟这种编解码已经成为目前视频拍摄的主流,在保持画质优秀的前提下有着更小的视频体积与更低的网速要求。

随着RTX 50系列显卡的推出,新增了对H.264和H.265视频格式的4:2:2色度采样解码支持。这一升级使视频编辑者能够直接处理原生4:2:2色度采样的视频内容,无需再依赖代理视频的生成,从而显著提升了编辑效率和工作流程的流畅性。从上图能看到RTX 5090在编码完成时间上彻底吊打CPU。

关于GeForceRTX 5070 Ti的规格:

GeForce RTX 5070 Ti采用基于Blackwell架构的GB203芯片,与完整规格的RTX 5080相比,性能略有下降,但相较于GeForce RTX 4070 Ti系列有明显提升。它同样搭载了新架构的核心特性,包括Gen 4 RT核心、Gen 5 Tensor核心、新一代媒体引擎、DLSS 4以及更多AI功能支持。此外,媒体引擎部分配备了2个第9代NVENC编码器和1个第6代NVDEC解码器。

在硬件规格上,GeForce RTX 5070 Ti所用的GB203芯片配备8960个CUDA核心、70个RT核心、280个Tensor核心、280个纹理单元和96个光栅单元,分布在70个流处理器多单元里面。

GeForce RTX 5070 Ti 与上代的GeForce RTX 4070 Ti相比,显存位宽从192Bit升级到了256Bit。得益于GDDR7显存,其显存带宽达到了896GB/s,比RTX 4080的716.8GB/s增幅多达25%。

测试平台简介:

测试平台配置:R7 9800X 3D+B650+DDR5 6800MHz 16G*2+额定1000W电源。为了方便参考,我加入GeForce RTX 4070 Ti作为性能对比。

目前2.62GPU-Z基本识别出显卡的大部分规格参数,从图中能发现啊鲁手上这块七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB的Boost频率最高可以去到2910MHz。PS:以下所有测试均在显卡开启一键超频状态下进行。

3D理论测试:

3DMARK基准测试方面,GeForce RTX 5070 Ti 与GeForce RTX 4070 Ti整体领先幅度在17~51%左右,绝大多数走在30%+,这提升可以说相当夸张。

3DM DLSS4测试,先看性能档,2x、3x、4x的帧率均轻松达到150~250,有点追求选择质量档的话也有120~208的出色表现,反观没有DLSS的加持,原生帧率只有42,DLSS4 4x与之相比,领先幅度高达514%,这提升幅度属实恐怖!

DLSS4游戏测试:

有鉴于GeForce RTX 5070 Ti的显存规格已经不输甚至超越了上代自己的老大哥GeForce RTX 4080,因此本次游戏测试在4K分辨率最高画质下设定进行。而且4K分辨率显示器如今已经相当普遍,因此GeForce RTX 5070 Ti的定位能否"越级"挑战4K,做人嘛,没点追求就跟咸鱼一样了。游戏测试马上走起。

《赛博朋克2077:往日之影》在4K分辨率,光线追踪画质最高的设定下,原生帧率只有16的PPT卡顿级别。开启DLSS2~4x后游戏平均帧率跃然提升至88~162,这个优秀表现让我大大增强了GeForce RTX 5070 Ti选择4K分辨率进行测试的信心,毕竟这帧率和性能表现还有必要用2K分辨率进行测试吗?

再来看这个新一代号称显卡杀手游戏《心灵杀手2》,原生帧率确实惨不忍睹,在DLSS4加持下,游戏帧率飙升至90~162,DLSS4 4x相比原生帧率相比提升幅度高达671%!

《星球杀手:亡命之徒》目前已经正式支持DLSS4.0,原生与DLSS4 4x两者帧率差距高达98。很难想象这是同一款显卡在不同画质设定下的差距,看来科技是第一生产力诚不欺我。

热门游戏测试:

热门游戏测试,如果说GeForce RTX 4070 Ti在部分游戏中未能达到4K最高画质60帧的流畅起跑线是个遗憾的话,GeForce RTX 5070 Ti已经很好的完成它上一代对游戏平均帧率突破60帧的夙愿,70+~170+的平均帧率试问舍我其谁?

生产力、AI性能测试:

在现在几乎人人自媒体的时代,哪怕你不是臭打游戏的,相信你也会为自己的电脑生产力而进行投入,GeForce RTX 5070 Ti除了游戏表现出色,在视频编辑方面的生产力方面也是一把好手,啊鲁用Procyon对两代显卡进行AdobePremiere Pro视频剪辑测试,从上图能看到得益于新的Blackwell架构,GeForce RTX 5070 Ti的视频剪辑性能相比GeForce RTX 4070 Ti提升了21%。

VARYGPU渲染测试方面,GeForce RTX 5070 Ti领先GeForce RTX 4070 Ti约45%,对于这么一款常用的3D渲染器,新一代显卡的生产力提升幅度还是很明显的!大大节省工作时间。

AI方面也是目前生产力一大重点,利用Procyon进行Text Generation测试,看看两块新旧显卡的AI文字生成能力有多大差距,从上图能看到性能提升幅度在20%~67%!,可见未来你想畅玩AI生产力,一块GeForce RTX 50系列显卡是必不可少。

功耗和温度:

在室温30℃环境下,利用Furmark进行显卡烤机满载十分钟测试,显卡满载温度仅为66℃,显卡功耗是315W,风扇转速为2356rpm。GPU加速频率最高去到2700MHz。

烤机时显卡正面的最高温度为41.9℃。

显卡背面高温位置是GPU后面,温度是58.2℃。

显卡鉴赏:

火神系列作为七彩虹旗舰显卡的明星产品,凭借霸气的外观以及优秀的做工用料,一直深受DIY玩家的喜爱。本次测试的主角正是七彩虹七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB。

显卡外观设计采用智械装甲设计,看起来分外有金属质感,要知道这可是全金属压铸工艺打造,对于男生来说很难抵抗这种弄设计魅力。造型集成经典三角元素,让显卡看起来层次感十足,鲜明的轮廓是它给人的第一印象!

竖起来看是不是更觉得霸气侧漏?一股肌肉般的力量美感油然而生!

正面三枚风镰扇叶,数量为9翼,叶片环环相连,带来出色的聚风散热效果。

风扇内置双滚珠轴承,柔滑顺畅,耐用度更加出色,超长的使用寿命让用户省心省力。

显卡尾部iGame的高亮边条,让整块显卡看起来低调不失B格。

隐藏在风扇后面的是大面积导流型鳍片,其出色的散热表现最早应用于服务器领域,凭借更大间隙,让风流充分进入加速内部气流循环,大大提升散热效率。

针对玩家追求个性,七彩虹七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB配备了LCD智屏,通过机械旋转结构,能实现屏幕翻转和角度调节,最大限度提升屏幕多角度的显示形态。

如果你对智屏兴趣不大,那么iGAME VULCAN灯光组建应该能满足你光污染的需求,同样采用磁吸连接设计,方便用户随时更换。

显卡背面采用全金属背板,背板带有磨砂处理,配合不规则的造型凹陷,让显卡背面的颜值也尽显风骚。

I/O接口方面3*DP2.1b接口与1HDMI2.1b接口可以说满足多屏扩展的需要,一键超频可以说是iGame显卡的杀手锏,给予玩家更优秀的性能体验。

iGame VULCAN

智屏还能通过附送的底座进行单独放置,通过软件设定能让玩家对电脑硬件情况进行实时监控,实用性与个性都拉满了。

iGame Center灯效一览:

多种灯效让你爱不释手!

藏于显卡边缘的光刃对显卡颜值起到画龙点睛的作用!

智屏装上显卡后能通过iGame Center进行自定义图像显示,又或者通过智屏素材库里面的丰富类别进行设定,充分满足喜爱个性的你。如果你追求实用性,它还能显示CPU\GPU多项监控数据轮播,让人不禁赞叹该设计实用与美学都满分。

总结:

不得不说这次上手七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB显卡让我惊喜连连,首先是新一代架构让其拥流畅酣战4K全高画质光追游戏的出色游戏性能,彻底打破多年以来NVIDIA 70后缀显卡只能征战2K分辨率的固有印象。

其背后功臣除了除了优秀的Backwell架构,16GB更大更快的GDDR7显存以及256bit位宽也是功不可没,相比上代产品GeForce RTX 4070 Ti相比提升有着30%的幅度。而且优秀的游戏性能同时有着不高的功耗,做到了鱼与熊掌兼得。各位有着爽玩游戏+大幅提升生产力需求的用户来说,不妨多多考虑这款产品。

测试平台配件简介:

测试平台使用了MPG A1000GS PCIE5电源。该电源符合80PLUS金牌认证,采用全日系105°C电容,品质更出色。原生支持 PCIe 5.1 及 ATX 3.1规格显卡。采用单路12v输出设计,能更好喂饱高功耗显卡,电源旁边带有微星龙标和MPG信仰标识。电源后面的是按钮用于开关风扇自动启停,兼顾静音和散热效能。

内存用的是金士顿Renegade叛逆者骇客神条DDR5 7600MHz 16G*2,该产品系列有6000~7600MHz频率多档可选,满足不同需求的用户。该内存支持XMP3.0规范,CL38低时序,银黑色铝制马甲看起来颜值颇高,而且能为内存颗粒带来不错的散热效果,片内ECC和板载PMIC提供更出色的稳定性,两个独立的32位通道能大幅提升多核处理器的数据效率。

0 阅读:0
啊鲁

啊鲁

最新最火爆的电脑、数码资讯评测第一时间为你精彩呈现!