在CES2025大展上,英伟达推出了基于Blackwell架构的GeForceRTX50系列游戏显卡。IT之家已经拿到了技嘉GeForceRTX5080GAMINGOC16G。这款显卡采用了全新一代的Blackwell架构,配备了GDDR7256Bit显存,容量高达16GB,支持DLSS4技术,能在很大程度上提升游戏帧率。另外,其配备的风之力散热系统相比于公版解热性能更好,可以充分发挥RTX5080的全部实力。
为了释放技嘉RTX5080魔鹰的全部性能,本次测试平台具体配置如下:
一、外观设计
技嘉GeForceRTX5080GAMINGOC16G采用全黑设计,其风之力散热系统拥有三枚大尺寸的仿生散热风扇。其设计灵感来源于鹰的翅膀,形态更加符合空气动力学,有效降低了风阻和噪音,在低噪音表现的同时,可将风压提升高达53.6%,风量提升12.5%。
技嘉魔鹰RTX5080背部采用大面积镂空设计,透过格栅可以看到风之力散热系统大面积的散热鳍片,背部黑色的线条涂装也使得显卡透露着满满的黑科技。
体积方面经过IT之家实测,技嘉魔鹰RTX5080显卡的三围分别是330*128*69mm(不含金手指与挡片),裸卡重量约1.84kg。
技嘉魔鹰RTX5080的右侧预留的显卡安装支架的三个孔位,安装时用两个即可固定住显卡。
技嘉魔鹰RTX5080的顶部为大面积散热鳍片,左侧印有GEFORCERTXLOGO右侧则是支持滑动的GIGABYTE的LOGO,可透过RGB灯条发光。
技嘉魔鹰RTX5080的供电接口具备指示灯提示功能,若是指示灯熄灭就是电源线连接正常状态,若是亮起则是电源线未连接,若是闪烁则是电源异常。这样设计的好处是可以避免电源连接不良或是忘记接电源的造成显卡故障。
技嘉魔鹰RTX5080除了一根转3*8pin电源转接线外,还附送了显卡支架,支架支撑部分有两种尺寸可以安装,以适配不同的机箱。
技嘉GeForceRTX5080GAMINGOC16G的I/O金属挡板上,配备了3个DP2.1b接口和1个HDMI2.1b接口,支持最高8K/165Hz输出。
二、技术解析
NVIDIAGeForceRTX5080搭载了全新的Blackwell架构,其在游戏性能与AI性能方面均有大幅提升。英伟达认为当下人们对画面质量的追求,其所需的运算性能已远超摩尔定律所能提供的范畴。在此情形下,引入神经网络渲染技术以提高帧率才能满足人们对于画质与帧率的高需求。
得益于神经网络渲染的融入,Blackwell的多单元流处理器(SM)实现了处理吞吐量的提升,并且与TensorCore的结合更为紧密,这一优化有效提升了神经网络着色器的性能表现。
为确保下一代DLSS多帧生成技术下帧率的稳定性,Blackwell架构特别配备了基于硬件的FlipMetering。这一技术将帧率逻辑转移至显示引擎内,使GPU能够更精准地把控显示时间。不仅如此,显示引擎的像素处理能力也得到了翻倍增强,从而能够更好地支持更高的分辨率与刷新率,充分释放DLSS4的性能潜力。
第五代TensorCore支持FP4浮点运算精度,这种低量化方法类似文件压缩,能减少模型推理的数据存储与计算量,提升计算效率,显存使用不到FP16的一半,却可让GPU性能提升2倍。
RTCore提升了光线、路径与三角形相交的检测效能,能对大量几何图形细节光线追踪。在新一代Blackwell架构下,检测效率是上一代的2倍、初代Turing架构的8倍,还通过增强压缩减少25%内存占用,大幅提升光线追踪细节。
Blackwell架构GPU搭载GDDR7显存,采用PAM3信号编码机制,与GDDR6、GDDR6X不同,每两周期传输3位数据,更省电且带宽提升,速度达30Gbps。
具体到产品规格上,技嘉GeForceRTX5080GAMINGOC16G基于最新一代GB200-400-A1核心和TSMC4N架构制程工艺打造,内有10752个CUDA核心、336个Tensor核心、84个光追核心、336个纹理单元、128个ROP单元,核心规模相比RTX4080提升约为10.5%,单元内的SM和TPC群组数量也均有增加。GeForceRTX5080的核心频率范围是2.3Hz-2.62GHz。显存方面升级为256-bit16GBGDDR7,带宽来到了960GB/s。TGP功耗为360W,相比上代RTX4080增加了40W。
三、理论跑分
作为一款高端显卡,GeForceRTX5080有着怎么的性能与性能释放呢?接下来就进入理论测试环节。先看烤机,单烤甜甜圈10分钟,GPU的核心温度稳定在63.5℃左右,要比公版的73.4°C低很多,显卡频率2600MHz,整张显卡的功率在360W左右,与英伟达官方的TGP保持一致。搭配i7/i9或锐龙7、锐龙9这样的高端处理器,1000W的电源足矣。
在3DMarkTimeSpyDX12测试中,技嘉GeForceRTX5080GAMINGOC16G分数达到了33159分,比公版的32022要高出一千多分。作为对比GeForceRTX4080s公版的分数为29220分,提升约为13%,提升幅度较大。
而在3DMarkTimeSpyExtremeDX12测试中,技嘉GeForceRTX5080GAMINGOC16G分数达到了16448分,作为对比RTX4080s公版的分数为14541分,提升幅度同样为13%。
在3DMarkPortalRoyal实时光追测试中,技嘉GeForceRTX5080GAMINGOC16G的综合分为22587分,作为对比RTX5080公版为22060分,RTX4080s公版的分数为18439分,提升幅度达到了22%。
通过3DMark一系列的显卡测试项目跑分不难发现,技嘉GeForceRTX5080GAMINGOC16G的图形性能相比公版RTX5080有略微提升,相比RTX4080s各项测试有着13%-22%左右的提升幅度。
四、游戏实测
这次的游戏实测稍微有点不同,虽然NVIDIA官方宣称首批支持DLSS4的游戏高达75款,不过目前要想在游戏中顺利开启DLSS4相关选项还需要通过Steam的测试版通道激活,所以多数主流游戏我们依旧测试的是DLSS3和帧生成的表现,并在最后以《赛博朋克:2077》这款游戏单独为大家呈现DLSS4技术的实际表现。
1、《CS2》
首先是《CS2》,这款游戏相较于《CS:GO》性能压力大了不少,不过即便如此技嘉GeForceRTX5080GAMINGOC16G依旧在4K分辨率+高画质下跑出了298分的游戏平均帧数,1%Low帧也有137.6帧。
而在2K分辨率+高画质下则跑到了平均490.8帧的游戏帧数,1%Low帧提升到235.8帧,完全不会影响游戏发挥。
2、《永劫无间》
竞技游戏我们选择测试的是《永劫无间》和《漫威争锋》,《永劫无间》目前支持了DLSS和帧生成技术,我们打开DLSS选项前后4K与2K的帧率表现。在4K分辨率+高画质+DLSS质量档+帧生成/低延迟下,游戏平均帧数148帧,1%Low帧100帧,游戏平均延迟28ms;
在2K分辨率+高画质+DLSS质量档+帧生成/低延迟下,游戏平均帧数217帧,游戏平均延迟20ms;
3、《无限暖暖》
接下来是两款端游,首先是“优化出色”的《无限暖暖》,这款游戏开启光追后对硬件资源的开销非常大,完全不输3A大作。
在4K分辨率+极致画质+上采样抗锯齿下,游戏平均帧数为114帧,1%Low帧92帧;
在4K分辨率+极致画质+DLSS抗锯齿下,游戏平均帧数为107帧,1%Low帧80帧;
整体接近于上一代卡皇RTX4090的游戏帧数,游戏明显更加流畅,操作也更加跟手了。
在2K分辨率+极致画质+上采样抗锯齿下,游戏平均帧数为159帧,1%Low帧143帧;
在2K分辨率+极致画质+DLSS抗锯齿下,游戏平均帧数为155帧,1%Low帧95帧;
4、《古墓丽影:暗影》
传统光栅单机游戏可以考察一下RTX5080在非光追和DLSS时的性能表现:
在4K分辨率+最高画质下,游戏平均帧数为152帧;
在2K分辨率+最高画质下,游戏平均帧数为279帧;
5、《极限竞速:地平线5》
《极限竞速:地平线5》有着较为出色的优化:
在4K分辨率+极端画质下,游戏平均帧数为157帧,1%Low帧129帧;
在2K分辨率+极端画质下,游戏平均帧数为212帧,1%Low帧149帧;
相比公版RTX4080s,4K和2K分辨率下的游戏平均帧数提升分别达到了23%和42%。
6、《孤岛惊魂6》
接下来就是光追游戏了,首先是《孤岛惊魂6》,它对CPU的单核性能要求也很高,支持光追和DLSS。经过实测:
在4K分辨率+极高画质下,游戏平均帧数为135帧,1%Low帧121帧;
在4K分辨率+极高画质+开启光追+DLSS质量下,游戏平均帧数为118帧,1%Low帧105帧;
在2K分辨率+极高画质下,游戏平均帧数为209帧,1%Low帧191帧;
在2K分辨率+极高画质+开启光追+DLSS质量下,游戏平均帧数为181帧,1%Low帧164帧;
7、《黑神话:悟空》
在测试绕不开的“众生平等”之作《黑神话:悟空》中:
4K分辨率+影视级画质+30%超采样分辨率+高全景光追,游戏平均帧数为83帧;
4K分辨率+影视级画质+30%超采样分辨率+高全景光追+帧生成下,游戏平均帧数为126帧;
可以看到在RTX5080的加持下,4K分辨率+影视级画质的黑猴也能达到120帧以上的游戏平均帧数,体验提升巨大。
而切换到2K分辨率后:
在2K分辨率+影视级画质+30%超采样分辨率下,游戏平均帧数为110帧;
在2K分辨率+影视级画质+30%超采样分辨率+高全景光追+帧生成下,游戏平均帧数为160帧;
8、《真三国无双:起源》
最后我们再测一款刚发售不久的游戏《真三国无双:起源》,它恰好就在首批支持DLSS4技术的75款游戏当中,可惜目前游戏还未激活DLSS4选项开关,只能看看它在DLSS3下的表现了。
在4K分辨率+最高画质,游戏平均帧数为112帧,1%Low帧为83帧;
在4K分辨率+最高画质+DLSS质量+帧生成,游戏平均帧数为208帧,1%Low帧116帧;
作为一款优化非常出色的游戏,RTX5080在4K分辨率下不开光追和DLSS选项,都能得到较高帧平均帧数,无双割草的体验感拉满。
五、DLSS4游戏体验
其实RTX40系列所支持的DLSS3技术,实际展现出的游戏帧率提升效果就已然十分卓越。而DLSS4技术则是在DLSS3的基础上,进一步挖掘并提升了帧生成的性能潜力。它运用了全新的多帧生成技术,借助第五代TensorCore的强劲性能,通过AI技术,能够为每一个渲染帧生成多达3个额外的帧,进而显著提升游戏的FPS。
DLSS4可以与光线重建、超分辨率以及DLAA等一系列DLSS技术协同工作,最高可使游戏帧率达到传统图像渲染方式的8倍。当玩家在游戏中启用DLSS4技术,搭配RTX5080显卡,便能够轻松实现开启全景光线追踪的4K分辨率高帧率游戏体验。
GeForceRTX50系列的第5代TensorCore,AI处理性能相比前代提升2.5倍,极大抑制游戏延迟增长,后续游戏实例将演示延迟实际变化。Blackwell显示引擎也对DLSS4技术有着重要意义,能提升像素处理能力,助力游戏在高分辨率和刷新率下适配DLSS4技术,最高可使像素处理能力翻倍。
DLSS4技术实现了模型架构的重大革新。DLSS光线重建、DLSS超分辨率以及DLAA这些特性,均由首个实时Transformer模型驱动,该模型旨在提升生成像素的质量。它能够借助自注意力操作,对一帧或多帧画面中的每个像素的重要程度进行评估,从而更好地理解场景中的各种关系。通过这种方式,生成的像素稳定性更佳,伪影更少,同时在运动细节的呈现上更为丰富,边缘也更加平滑。
英伟达宣称,当下已有超75款支持DLSS帧生成技术的游戏与应用,在GeForceRTX50系列GPU上可升级为DLSS多帧生成技术。50系显卡正式发售后不久,众多主流3A大作也将适配DLSS4,其中涵盖《心灵杀手2》《夺宝奇兵:古老之圈》《真三国无双:起源》《黑神话:悟空》《星球大战:亡命之徒》以及《寂静岭2:重制版》等热门游戏。
《赛博朋克:2077》目前的steam测试版已支持DLSS4,我们通过它来了解下DLSS4的实际体验。如果是4K分辨率+超级画质,不开光追和DLSS,游戏平均帧数的表现还可以,能达到73.27帧。
接着我们看下多帧生成的选项,打开帧生成选项后,下面多出了一个多帧生成的倍率选择项,即DLSSMultiFrameGeneration,可选择2x、3x和4x这3种生成倍率。
我们依次在4K分辨率+超级光追画质+DLSS性能设置下,选择2x、3x和4x多帧生成,运行游戏基准测试,分别得到了149.49帧、206.15帧和255..69帧的游戏平均帧数,2x和3x多帧生成的表现,非常接近71.25帧的2倍和3倍帧数,在4K分辨率下超240帧的超级光追画质体验远超我们的预期,画面流畅度极高。
当我们进一步切换到超速光追画质+DLSS4多帧生成时,游戏平均帧数分别也有106.3帧、150.81帧、189.68帧。对于硬件性能要求极高的一款3A游戏中,我们竟获得了前所未有的游戏性能体验。不得不说,DLSS4技术的出现,完全打破了大家以往对游戏性能的固有认知。
当然,无论是何种形式的插帧,延迟的增加都不可避免,所以我们也实测了关闭和打开多帧生成后的延迟表现。在关闭帧生成选项的情况下,我们测试4K超速光追画质的游戏平均延为33ms。依旧在同一场景下分别开启2x、3x和4x多帧生成,游戏平均延迟分别为41ms、44ms和49ms。
如此看来相比开启帧生成之前,延迟的确有一定的增加。不过随后的3x和4x多帧生成延迟依次递增3ms、5ms,总体延迟都控制在50ms以内,对于非竞技类单机游戏来说这个表现完全可以接受。
针对目前DLSS4适配游戏较少的问题,英伟达推出了DLSSOverride功能进行缓解,这个功能能让支持DLSS且还没有适配DLSS4的游戏获得DLSS4的帧生成和超分体验。
我们以《漫威争锋》为例,在4K分辨率+高画质+关闭DLSS情况下,游戏平均帧数155帧,1%Low帧63帧,游戏平均延迟15ms;
在4K分辨率+高画质+DLSS质量档,游戏平均帧数185帧,1%Low帧107帧,游戏平均延迟25ms;
在同样情境下,启用DLSSOverride,并将DLSS4帧生成设置为X4后,游戏平均帧数372帧,1%Low帧206帧,游戏平均延迟22ms。游戏帧率得到大幅度提升,体验和原生适配DLSS4已经很接近了。
除DLSS4技术外,新一代NVIDIAReflex2低延迟技术进一步降低游戏延迟,提升操作手感与响应速度。过去四年,NVIDIAReflex已集成超100款游戏,能将PC延迟降低50%。新Reflex2采用ReflexFrameWarp技术,通过同步鼠标输入指令与渲染帧,实时控制游戏帧,实现定制化低延迟调整。未来,NVIDIAReflex2不仅支持《无畏契约》等主流竞技、动作游戏,搭配DLSS4,游戏低延迟表现将更出色。
六、生产力
生产力方面,IT之家实测了ULProcyon的照片编辑、视频剪辑、以及AI文本撰写等性能。在照片编辑上,技嘉魔鹰RTX5080配合AMD9800X3D获得了9369分比公版RTX5080高了683分。
在视频剪辑性能测试中我们开启了GPU加速,得益于RTX5080Blackwell架构的第九代NVENC,其在H.264/H.2654:2:2编码的8位和10位视频上有着非常大的优势,技嘉魔鹰RTX5080最终获得了63208分,比公版RTX5080高了575分。
最后是考验AI性能的大语言模型测试,面对13B参数量的LLAMA2模型平均OTS也有着84.49tokens/s,相比于公版RTX5080的83.48tokens/s有所提升,表现出色。
七、总结
在这次对技嘉GeForceRTX5080GAMINGOC16G的首次测试中,我们获得了极为深刻的印象。特别是在第五代TensorCore与DLSS4技术的双重助力下,游戏性能的提升十分显著,游戏帧数成倍增长变得轻而易举。并且,其风之力散热系统的表现也极为出色,技嘉魔鹰RTX5080搭配新一代仿生风扇,有效降低了风阻和噪音,其在低噪音表现的同时,可将风压提升高达53.6%,风量提升12.5%,升级导热凝胶,
大型均热板和复合式热管、进气格栅等散热技术进一步提升产品散热性能。其性能与散热要优于公版RTX5080。关于技嘉GeForceRTX5080GAMINGOC16G售价到小编截稿时还是未定状态。除此之外,技嘉也同步推出了技嘉GeForceRTX5080SFF风魔OC显卡,这款显卡同样搭载新一代仿生风扇,同时满足NVIDIASFF-Ready标准,更适合小尺寸机箱用户使用,这款显卡售价8299元,也与今天同步开售。
DLSS4技术的应用,将为显卡游戏性能开启全新篇章。一方面,广大玩家将迎来更流畅、精彩的游戏体验;另一方面,游戏开发者也获得了更广阔的创作天地,能够打造出画面更精美、运行更流畅的游戏作品。