英伟达 RTX 神经纹理压缩技术基准测试:最高可降低 96% 显存用量

xxn 阅读:1474 2025-02-09 08:01:10 评论:0
```html

IT之家 2 月 9 日消息,YouTube 频道 Compusemble 对英伟达最新的 RTX 神经纹理压缩(NTC)技术进行了基准测试,充分展示了其在实际 3D 工作负载中的卓越性能。测试结果显示,与传统纹理压缩方法相比,RTX NTC 技术可以将纹理内存需求降低高达 96%

据IT之家了解,Compusemble 在 RTX 4090 显卡上分别以 1440p 和 4K 分辨率对 NTC 技术进行了评测,测试包括两种模式:“NTC 转码为 BCn”和“样本推理”。在“NTC 转码为 BCn”模式下,纹理在加载时转码为 BCn 格式;而“样本推理”模式则仅解压缩渲染特定视图所需的单个 texel,从而显著减少纹理内存占用。

在 1440p 分辨率下,启用 DLSS 超分功能时,“NTC 转码为 BCn”模式将测试应用的纹理内存占用从 272MB 降至 98MB,减少幅度达到 64%。而在“样本推理”模式中,纹理大小缩减至仅 11.37MB,与传统压缩技术相比,内存占用降低了 95.8%,相较于旧版神经压缩模式也减少了 88%

值得一提的是,启用 RTX 神经纹理压缩技术后,性能可能会受到一定程度的影响。尽管如此,由于测试中使用的是上一代 RTX 4090 显卡,而非最新的 RTX 5090 显卡,未来新一代架构的推出可能有助于减少性能损失。

在“NTC 转码为 BCn”模式下,平均 FPS 与未启用 NTC 时相比几乎没有变化,而“样本推理”模式的性能下降最为显著,FPS 从 1600 多帧降至 1500 多帧,1% 的低值更是剧降至约 840 帧。

使用 TAA 抗锯齿而非 DLSS 超分时,内存容量的减少幅度与 DLSS 相近,但 GPU 的性能表现有所不同。三种模式的运行速度明显快于 DLSS,FPS 接近 2000 帧。在“样本推理”模式下,1% 的低值达到 1300 多帧,比 840 帧有了显著提升。

将分辨率提升至 4K 后,性能显著降低。启用 DLSS 超分时,“NTC 转码为 BCn”模式的平均 FPS 约为 1100 帧,而“样本推理”模式的平均 FPS 则略低于 1000 帧,两种模式的 1% 低值均在 500 帧左右。

如果关闭 DLSS,采用原生分辨率和 TAA 抗锯齿, “NTC 转码为 BCn”模式的平均 FPS 升至大约 1700 帧,而“样本推理”模式的平均 FPS 约为 1500 帧。前者的 1% 低值略低于 1100 帧,后者的 1% 低值略低于 800 帧。

此外,Compusemble 还在 4K 分辨率下对“样本推理”模式进行了协同向量功能的测试。启用协同向量时,平均帧率在 1500 帧左右;关闭协同向量时,平均 FPS 猛降至略低于 650 帧。1% 的低值在开启协同向量时略低于 750 帧,关闭时加大至略高于 400 帧。

据 Compusemble 的基准测试表明,英伟达的神经压缩技术不仅大幅降低了3D应用的纹理内存占用,同时也以一定程度的性能牺牲为代价,尤其在“样本推理”模式下

RTX 神经纹理压缩技术已经经过了数年的研发。这项前沿技术通过利用现代英伟达 GPU 中的张量核心,针对 3D 应用及游戏纹理进行压缩,而不再依赖传统的块截断编码。RTX NTC 是自 1990 年代以来纹理压缩技术的一次重大进步,能够支持比现有 GPU 更高四倍的纹理分辨率。

当前,RTX NTC 技术仍处于测试阶段,具体发布日期尚未确定。值得注意的是,其最低硬件要求相对较低。英伟达在 GitHub 上的 RTX NTC 页面确认,最低 GPU 要求为 RTX 20 系列显卡。此外,该技术还在 GTX 10 系列、AMD Radeon RX 6000 系列以及 Arc A 系列显卡上得到验证,显示出该技术未来可能在非 RTX 显卡和游戏主机上广泛应用的潜力。

广告声明:文中包含的外部链接(包括但不限于超链接、二维码、口令等形式)旨在提供更多信息,节省筛选时间,结果仅供参考。

```
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容