要说今年最火的科技话题是什么,除了AI之外你确实很难找出第二个。而且这股AI风潮不只是在大企业之间涌动,就连个人也能参与其中,就操作来说,在自己的电脑上部署模型并非难事,唯一的挑战,可能来自设备本身,毕竟一分钟出一张图和一秒钟出一张,给人的感受已经算得上是截然不同。
而为了让创作者和爱好者们能够更好地体验AI,技嘉在Computex 2024上正式推出了一个名为AI TOP的新系列,目前旗下产品包括主板、显卡、电源和SSD。我们今天要评测的不是别的,正是AI硬件中最为核心的那部分——RTX 4070 Ti SUPER AI TOP显卡。当然,和其他所有的显卡评测一样,游戏方面的测试我们也会去做,毕竟玩游戏也是RTX显卡的重要职能。
规格RTX 4070 Ti SUPER AI TOP不是一张OC版本的卡,Boost频率和公版的一样是2610MHz。值得一提的是,它在尺寸上符合NVIDIA最近推出的SFF-Ready标准,可轻松置身于兼容该标准的小机箱中。
外观设计先说重点,RTX 4070 Ti SUPER AI TOP是一张双槽涡轮卡,有微小的越肩,但无伤大雅。考虑到自RTX 20系以来面向个人用户发售的涡轮卡已渐成“珍稀动物”的现状,技嘉的这款显卡无疑为一小部分钟爱涡轮卡的人们带来了新的选择。
设计风格上,涡轮卡的性质和AI TOP系列的定位就意味着RTX 4070 Ti SUPER AI TOP并不是一张很张扬的显卡,和技嘉其他面向创作者系列的产品一样,这张显卡的装饰很少,沉稳和专业是它给人的第一印象。
当然了,淡蓝色的铝合金外壳仍带来了出色的观感和触感。技嘉对边角和一些位置的处理是很出色的,这里我要着重提一下侧面,可以看到AI TOP的LOGO并不是在纯平的面上凸起,技嘉在这里做了一个微小的直线凹痕,令侧面不会那么单调。
涡轮风扇区域的高度比其他地方稍低,技嘉表示该设计是为多卡堆叠所做的一个优化,可以提高进风量。RTX 4070 Ti SUPER AI TOP所采用的双滚珠轴承风扇在性能和寿命上都比传统的套筒风扇更为出色。
技嘉把16-pin电源接口放在了尾部。不过可能是为了避让这3个固定螺丝孔,这个电源接口比较偏上,因此侧面也不得不开了一个角。
RTX 4070 Ti SUPER AI TOP是有金属背板的,长度约为全长的1/4。除了AI TOP和GEFORCE RTX的LOGO外,技嘉还在上面绘制了数束弧线作为装饰,毕竟背板很平,光是印LOGO上去也显得有点单调。
和一些涡轮卡不同,RTX 4070 Ti SUPER AI TOP并没有选择在PCB上打孔来增加通风通道,但另一方面来说,如果不打孔的话,金属背板做全长应该也不是什么问题,现在这样缺一块总让人有些迷惑。不过要是和前面的风扇区域对照着看的话,倒也是能理解技嘉的思路:如果这里能尽量窄的话,多卡堆叠时进气通道就宽了。
因为尾部是出风口,所以能看见技嘉在这里做了面积挺大的梯形状的开孔,一眼就能看到里面的纯铜散热鳍片。
内部构造因为RTX 4070 Ti SUPER AI TOP确实不是一张以外观见长的显卡,所以它的外观部分其实能说的不多。相反,它的内部结构就挺丰富的,甚至能解释一些外观上的问题。
显卡外壳上的导热贴面积相当大,甚至连导风罩上也有。考虑到导风罩材质同样是金属,充分利用这点来提升散热性能还是很有必要的。另外,在这个角度也能看到外壳的处理工艺相当不错。
接下来是散热模块。RTX 4070 Ti SUPER AI TOP的散热模块由三个组件构成:首先是纯铜的均热板和散热鳍片,凸起的均热板主要覆盖了GPU区域,同时PCB上的大部分电感也是直接接触底座。其次是金属框架,显存、MOSFET这些是跟它接触的,涡轮风扇(这是第三个组件)也是通过螺丝固定在它上面。从这个框架的覆盖面积上去说的话,与其说它是框架,还不如称其为金属中板,因为它直接盖住了整块PCB,就连末端的电感也有照顾到。
附带一提,如果像上文所述那般,想要实现背部入风的话,PCB开孔还不够,还得在金属中框上作相应的修改,工程量是挺大的。
从其他的RTX 4070 Ti SUPER乃至RTX 40系显卡的评测里面可以看到,这一代显卡的PCB布局都是偏紧凑的。因此你能看到虽然RTX 4070 Ti SUPER AI TOP的PCB很长,但组件都是挤在左半部分的。
AD103-275核心和美光MT61K512M32KPA-21:U(FBGA码为D8BZC)GDDR6X显存一如既往地位于中心部分,PCIe金手指的正上方。
显卡的供电规格是8 + 3。和很多显卡一样,它的电源管理芯片都在PCB背面,核心PWM是uPI uP9512R,显存PWM是uPI uP9529Q。在显存PWM的左下方还有一颗安森美NCP45491,用于电源监控。
uPI uP9512R
uPI uP9529Q与安森美NCP45491
MOSFET倒是一水的安森美NCP302150,平均电流可达50A。
显卡的右半部分很空,不过有一颗芯片很显眼,那是HOLTEK HT32F52352,一款ARM单片机,用于控制风扇。
测试平台与方法本次测试平台是以酷睿i9-13900KS、技嘉 Z790 AORUS ELITE AX-W为核心的PC,可以保证技嘉RTX 4070 Ti SUPER AI TOP的全力发挥。附带一提,Resizable BAR功能是默认开启的。
AI生产力应用:提高工作效率,加速创意落地Stable Diffusion图像生成,TensorRT显著提速Stable Diffusion可以说是目前最热门的AI图像生成应用。为了便于比较不同运行时的效率,我们在这里就直接用UL Procyon的AI图像生成测试了,它使用的模型是Stable Diffusion 1.5(FP16),推理步数为100,分辨率为512 x 512,Batch Size为4,共生成16张图。
得益于NVIDIA特有的TensorRT带来的优化加速,RTX 4070 Ti SUPER AI TOP的每张图生成时间可缩短至2.3秒,而通用的ONNX-DirectML要将近3秒才能出一张图。显然,随着生成图片数量的增多,TensorRT节省的时间和带来的效率提升会更加明显。
NVIDIA Canvas体验NVIDIA Canvas是NVIDIA出品的AI图像生成应用,它能够利用AI把简笔画转化成逼真且细节丰富的图像,速度是相当快的,基本上左边一画上去,右边就会显示对应的物体了。NVIDIA Canvas提供了多种风格的画布和笔刷,这使得我们可以在很短时间内就画出这幅要素齐全的风景图。另外,该应用还支持图层功能,可更细致地调整画面。
本地运行LLM,打造个人知识库基于LLM的聊天机器人也是目前颇为火热的AI应用,不过它们很多都需要联网访问,另一方面也可能存在隐私问题。而得益于RTX 4070 Ti SUPER AI TOP的性能,我们可以在本地运行LLM,同时利用RAG(检索增强生成)打造专属于自己的AI助手。
我们是通过Ollama这个开源工具来部署LLM的。在安装Ollama服务和Page Assist这个WebUI后,我们就能很方便地从Ollama的AI库里面下载我们想要的模型并进行部署。这次我们选择的是通义千问的Qwen2。另外,我们还为模型添加了一些文档,如图所示,它能够理解文档内容,为我们快速归纳RTX 40系列显卡的特性。
我们选择的是Qwen2-7B模型,可见它在运行时占用了约7GB显存,这对于16GB的RTX 4070 Ti SUPER AI TOP来说还是绰绰有余的。如果要运行更大尺寸的模型,就可能需要多张显卡堆叠了。
AI游戏:DLSS 3实现游戏性能倍增相比于AI创作,游戏并不是这张显卡的主打方向,不过这也并不代表RTX 4070 Ti SUPER AI TOP完全不能玩游戏。恰恰相反,目前仅RTX 40系列独占的DLSS 3技术也是利用了AI实现游戏的性能加速。这次,我们一共选择了支持光追和DLSS 3的4个游戏来进行光追和超分辨率、帧生成效能测试。因为RTX 4070 Ti SUPER还是一张定位2K分辨率的显卡,所以我们就测2K分辨率下的表现。可见在启用DLSS 3后,光追游戏的帧率都获得了较大幅度的提升。
温度测试温度测试分为待机和满载两个情景。待机是进入系统后的10分钟记录,而满载是3DMark Time Spy Extreme运行10分钟的记录。记录数据的应用是GPU-Z,频率是每秒一次。环境温度是27.2摄氏度。
RTX 4070 Ti SUPER AI TOP的风扇是全时运行的,在待机时转速也会维持在30%左右,约1168RPM。因此可以看到它在待机时的温度是会慢慢下降的,从34降到32度。满载运行时,这张显卡的温度在83-85度之间,最高温度能去到86.6度。比起一般采用下压式散热的显卡来说,涡轮卡的温度是会高一点,但正如前文所说的那样,涡轮卡这种结构是更适合多卡堆叠这个场景的,这其实是一个取舍问题。
功耗测试和以前一样,功耗测试和温度测试是同步进行的,因此各项设置与上面是保持一致的。只不过我们所用的记录软件和硬件是PCAT套件,由于数据量比较大,我们在图表中展示的是最后一分钟的数据。
RTX 4070 Ti SUPER AI TOP的待机功耗很低,平均只有约15W。满载功耗可达到286W,峰值功耗则可达324W。毕竟它不是一张OC版显卡,750W的电源也够用了。
噪音测试从GPU-Z的记录数据可知,RTX 4070 Ti SUPER AI TOP的风扇在待机时也保持30%左右,约1168RPM的转速;满载时显卡转速可以达到约52%,2325RPM。在环境噪音为15dBA的消音实验室中,噪声检测仪与显卡的距离为30cm的情况下,RTX 4070 Ti SUPER AI TOP待机时的噪音为36.4dBA,满载时则为56dBA。
总结正如命名中的AI一样,技嘉RTX 4070 Ti SUPER AI TOP这张显卡在AI应用方面有着出色的表现,TensorRT和显卡实现了软硬件结合,在Stable Diffusion有着更高的出图效率,也可以轻松运行现时流行的各种LLM,打造专属于自己的AI助手。至于游戏的话,DLSS 3这个就更不用说了,光追游戏下没它可不行。
当然了,相信除了本身的性能之外,技嘉RTX 4070 Ti SUPER AI TOP最为吸引人的应该就是它的散热类型和尺寸了。毕竟正如开头所说的那样,现在的玩家和个人创作者能选择的涡轮卡并不多,一张来自大厂的产品显然更值得信赖。更何况这是一张SFF-Ready Enthusiast GeForce显卡,对小机箱来说也是分外友好。