英伟达在其RTX 30系列和RTX 40系列显卡上有两个突出的功能:光线追踪和DLSS,它可以让您以虚拟化的更高分辨率玩游戏,保持更大的细节和更高的帧速率,而不会对您的显卡造成太大负担。
什么是DLSS?DLSS代表深度学习超级采样。“超级采样”位是指一种抗锯齿方法,用于平滑呈现的图形上显示的锯齿状边缘。但是,与其他形式的抗锯齿相比,SSAA(超级采样抗锯齿)的工作原理是以更高的分辨率渲染图像,并使用该数据来填补原始分辨率的空白。
“深度学习”是英伟达的秘密武器,利用机器学习的强大功能,Nvidia 可以通过高分辨率扫描来训练 AI 模型。然后,抗锯齿方法可以使用AI模型来填充缺少的信息。 SSAA 通常要求您在本地渲染更高分辨率的图像。
这要归功于英伟达的张量内核,这些内核仅在RTX GPU中可用(数据中心解决方案之外,如Nvidia A100)。虽然 RTX 20 系列 GPU 内部有张量内核,但 RTX 3060、3060 Ti、3070、3080 和 3090 都配备了 Nvidia 的第二代张量内核,可提供更高的单核性能。
英伟达最新的 RTX 40 系列显卡将张量内核提升到第四代。这使得DLSS提升更加强大。得益于新的8位浮点张量引擎,内核的吞吐量比上一代增加了五倍。
英伟达在这一领域处于领先地位,尽管AMD新的FidelityFX超分辨率功能可能会提供一些竞争。甚至英特尔也将很快发布自己的超级采样技术,称为英特尔XeSS,或英特尔Xe超级采样。
DLSS实际上是做什么的?DLSS是英伟达AI算法在以较低的分辨率渲染游戏后,DLSS 从其超分辨率图像训练知识库中推断出信息,以生成看起来较高分辨率运行的图像。我们的想法是使以1440p渲染的游戏看起来像是以4K或1080p游戏运行看起来像1440p,DLSS 2.0提供四倍的分辨率,允许您以1080p渲染游戏,同时以4K输出。
早期的DLSS游戏,如《最终幻想XV》,帧速率从每秒5帧提高到15 fps,而最近的版本则有更大的改进。英伟达为DLSS引入了一个新的AI引擎,可以提高图像质量,特别是在1080p等较低分辨率下,在某些情况下可以将帧速率提高50%以上。
随着DLSS 3的最新版本,帧速率增益可能会更加可观。英伟达展示了微软飞行模拟器的视频,其中帧速率得到了巨大的提升,从没有DLSS的64 fps增加到DLSS 3的135 fps。
DLSS用户还可以创建新的质量调整模式,在性能,平衡和质量之间进行选择,每种模式都将RTX GPU的张量核心马力集中在DLSS的不同方面。
DLSS是如何工作的?DLSS 强制游戏以较低的分辨率(通常为 1440p)渲染,然后使用其经过训练的 AI 算法来以更高的分辨率(通常为 4K)输出,通过利用一些抗锯齿效果(可能是Nvidia自己的TAA)和自动锐化来实现这一点。
AI算法经过训练,能够以极高的分辨率(据称是64倍的超级采样)采样某些游戏,并被提炼成只有几兆字节的大小,然后被添加到最新的Nvidia驱动程序版本中,供世界各地的游戏玩家使用。实际上,DLSS是英伟达截图增强Ansel技术的实时版本,它以较低的分辨率渲染图像以提供性能提升,然后应用各种效果以提供相对可比的整体效果,以提高分辨率。
在《死亡搁浅》中,我们看到1440p的渲染比原生渲染有了显著的改进。性能模式丢失了背面包装上的一些更精细的细节,质量模式保留了大部分细节,同时平滑了原生渲染的一些粗糙边缘。“DLSS关闭”屏幕截图显示了没有任何抗锯齿的质量。
有史以来的最佳效果DLSS有可能让那些高分辨率下无法流畅运行的游戏能够以更适合的帧率运行。DLSS 无疑是 RTX GPU 最强大的功能之一。光线追踪效果也很漂亮,但往往会对性能产生相当大的影响,但DLSS为我们提供了两全其美的优势:更好看的游戏,性能也更好。
最初,DLSS似乎是低端显卡的利好功能,但事实并非如此。相反,DLSS使《赛博朋克2077》和《Control》等游戏能够在高端硬件上提升视觉保真度,而不会使游戏无法流畅。
英伟达已经展示了RTX 3090渲染游戏,游戏玩家可以以1080p或1440p渲染,而不是以原生4K渲染并希望坚持50 fps到60 fps,现在玩家可以使用DLSS来填补缺失的信息,更高的帧速率,而不会明显降低图像质量。
DLSS也在不断改进,并且定期更新,改进AI算法。现在允许它更智能地使用运动矢量,有助于改善物体在移动时的外观,还减少了重影,使粒子效果看起来更清晰,并提高了稳定性。DLSS 2现已被广泛采用,截至2022年9月,已有216款游戏支持它。
DLSS 3 渲染帧而不是像素9月20日,在GTC 2022主题演讲中,英伟达宣布了DLSS 3 - RTX 40系列显卡所有者可以使用的最新版本的技术。与之前的一些较小的更新不同,这次对DLSS的更改很大,并且它们有可能提供巨大的性能提升。
这一次,DLSS将能够预测实际帧而不仅仅是像素,填充GPU未渲染的内容,并在许多游戏中提供帧速率提升。根据Nvidia的说法,DLSS 3的速度将是DLSS 2的四倍,并且它将能够提高大多数游戏的性能,包括主要依赖CPU而不是GPU的游戏。
如上所述,英伟达在微软飞行模拟器中展示了DLSS 3,收益非常大 - 这种类型的游戏达到135 fps,《赛博朋克2077》的收益也同样显著。
DLSS 与 RSR 与 XeSSAMD是英伟达在图形技术方面最大的竞争对手。为了与DLSS竞争,AMD于2021年发布了FX超分辨率采样(FSR)。尽管它实现了在提高帧速率的同时改善视觉效果的相同目标,但 FSR 的工作方式与 DLSS 完全不同。FSR 以较低的分辨率渲染帧,然后使用开源的空间升级算法使游戏看起来像是以更高的分辨率运行,并且不考虑运动矢量数据。DLSS使用AI算法来提供相同的结果,但这种技术仅由英伟达自己的RTX GPU支持。另一方面,FSR几乎可以在任何GPU上运行。
英特尔还一直在研究自己的超级采样技术,称为英特尔 XeSS 或英特尔 Xe 超级采样。这种图像升级技术同时使用空间和时间数据,即图像数据和运动数据,并利用AI进一步提高图像质量。它通过经过训练的神经网络传递数据,利用机器学习和AI来提高图像质量,这类似于DLSS。