越来越多游戏支援 Ray Tracing 技术,用家必需搭配 NVIDIA® GeForce RTX™ 系列的绘图卡才能享受真实光线效果,而且在性能上难免会付出代价,幸好 NVIDIA® 推出了 DLSS 2.0 技术,在同样的画质设置下,开启 DLSS 后能让游戏 FPS 提升最高达 75%,笔者这次借来 GIGABYTE GeForce® RTX 2080 SUPER™ Gaming OC 绘图,实测 Minecraft 游戏启动 GeForce RTX™ 与 DLSS 2.0 后,在游戏画质及性能上有何差异。
GeForce RTX™ 与 GeForce® GTX 有何不同 ?
随着 NVIDIA® 在新一代 GeForce RTX™ 系列绘图卡上加入实时光线追蹤技术后,XBOX Series X 及 Play Station 5 亦先后宣布将会支援实时 Ray-Tracing,相信在不久的将来,光线追蹤将会是游戏的标配。但是在谈论实时光线追蹤的效果前,先来重温一下 NVIDIA® GeForce RTX™ 20 系列绘图卡比上代多出的两大单元。
全新 RT Core 运算单元
NVIDIA® GeForce RTX™ 系列绘图卡中最核心的部分,当然就是新增了负责 Ray Tracing 的 RT Core。在过去的 GPU 架构中,绘图卡并无法对游戏及图形进行複杂的实时光线追蹤处理,NVIDIA® 经过过 10 年的研究及开发,终于在新一代「Turing」GPU 微架构中加入硬体光线追踪加速引擎 —「RT Cores」,结合 NVIDIA® GeForce RTX™ 软件引擎,实现逼真的实时光线场景效果。
全新「Turing」SM 模组内均拥有 1 个 RT Core,提供 BVH 边界体积层次遍历及射线三角测试硬体加速运算,从而节省了 SM 模组对每条光线的额外处理。每个 RT Core 内含两个专用单元,第一个单元进行边界框架测试,第二个单元进行射线三角交叉测试。
「Turing」SM 模组只需启动射线探测器,RT 核心执行 BVH 遍历和射线三角测试,并向 SM 返回命中或不命中,SM 可以空置并执行其他图形或运算工作。
受惠于全新RT Cores 运算单元,全新「Turing」绘图核心的光线跟踪性能,相较上代「Pascal」绘图核心有明显增长,使用「GeForce® GTX 1080」绘图核心执行软体光线射踪每秒可达成 0.89 Giga Rays,但使用「GeForce RTX™ 2080」绘图核心则可达至 8 Giga Rays,支援 NVIDIA® GeForce RTX™、Microsoft DXR 及 Vulkan API,为游戏和专业应用提供令人难以置信的逼真和物理精确的图形。
新增 Tensor Core 运算单元
NVIDIA® GeForce RTX™ 20 系列绘图卡採用全新「Turing」GPU 微架构,其中另一特点就是新增了增强型的 Tensor Core 运算单元,这是专门用于执行向量及矩阵运算的运算单元,包括 INT8 及 INT4 精度的函数运算,以及更高精度的 FP16 运算工作,主要用于深度学习神经网络运算、推理运算、矩阵运算等,提供更佳的硬体加速能力。
针对游戏应用层面,Tensor Cores 其中一个重点就是加入全新 DLSS 深度学习超级採样技术,透过深度神经网络提取渲染场景的多维特徵,并智能地组合来自多个帧的细节,以构建高质量 3D 影像。与传统的 AA 技术相比,DLSS 使用更少的输入样本,同时避免了透明度和其他复杂场景元素的算法难度,下文将会为大家实测全新 DLSS 2.0 技术能够到底能够带来多大的游戏 FPS 提升。
▲ Pascal 向量核心与 Turing Tensor Core 数目比较
全新「Turing」SM 模组内建 8 个 Tensor Cores,每个 Tensor Core 单一週期可执行 64 个 FMA 浮点融合乘加运算、64 个 FP16 乘法累加运算、128 个 FP16 运算、256 个 INT8 精度运算或 512 个 INT4 精度运算。