英伟达 RTX 神经纹理压缩技术基准测试：最高可降低 96% 显存用量

您的当前所在位置：首页行業要聞

发布时间：2025-02-10 08:43

2月9日消息，YouTube频道Compusemble对英伟达的RTX神经纹理压缩（NTC）技术进行了基准测试，展示了该技术在实际3D工作负载中的强大能力。测试结果显示，与传统纹理压缩技术相比，RTX NTC技术能够将纹理内存大小大幅降低96%。

IT之家注意到，Compusemble在RTX 4090显卡上分别以1440p和4K分辨率对NTC技术进行了测试。测试分为两种模式：“NTC转码为BCn”和“样本推理”。其中，“NTC转码为BCn”模式会在加载时将纹理转码为BCn格式；而“样本推理”模式则仅对渲染特定视图所需的单个texel进行解压缩，从而进一步减少纹理内存大小。

在1440p分辨率下，当启用DLSS超分功能时，“NTC转码为BCn”模式将测试应用的纹理内存占用从272MB降低至98MB，减少了64%。而“样本推理”模式则将纹理大小降至仅11.37MB，与非神经压缩技术相比，内存占用减少了95.8%，与之前的神经压缩模式相比减少了88%。

不过，启用RTX神经纹理压缩技术后，性能会受到一定影响。尽管如此，由于测试使用的是上一代RTX 4090显卡，而非最新的RTX 5090显卡，因此随着新一代架构的推出，性能损失可能会有所减少。

在“NTC转码为BCn”模式下，平均FPS与未启用NTC时相比几乎没有变化。而“样本推理”模式的性能下降最为明显，FPS从1600多帧的中等水平降至1500多帧的中等水平，1%的低值更是大幅降至840帧左右。

当使用TAA抗锯齿而非DLSS超分时，内存容量的减少情况与DLSS相同，但GPU的性能表现有所不同。三种模式的运行速度都明显快于DLSS，FPS接近2000帧。在“样本推理”模式下，1%的低值达到1300多帧，比840帧有了显著提升。

将分辨率提升至4K后，性能显著下降。启用DLSS超分功能时，“NTC转码为BCn”模式的平均FPS在1100帧左右，“样本推理”模式的平均FPS则略低于1000帧，两种模式的1%低值都在500帧左右。

而关闭DLSS，改用原生分辨率搭配TAA抗锯齿时，“NTC转码为BCn”模式的平均FPS提升至1700帧左右，“样本推理”模式的平均FPS在1500帧左右。前者的1%低值略低于1100帧，后者的1%低值略低于800帧。

此外，Compusemble还在4K分辨率下，针对“样本推理”模式测试了协同向量功能。启用协同向量时，平均帧率在1500帧左右；关闭协同向量时，平均FPS急剧下降至略低于650帧。1%的低值在启用协同向量时略低于750帧，关闭时略高于400帧。

Compusemble的基准测试表明，英伟达的神经压缩技术能够在大幅减少3D应用纹理内存占用的同时，以牺牲一定性能为代价，尤其是在“样本推理”模式下。

RTX神经纹理压缩技术已经开发了至少几年时间。这项新技术利用现代英伟达GPU中的张量核心来压缩3D应用和游戏纹理，而非传统的块截断编码。RTX NTC是自1990年代以来纹理压缩技术的首次重大升级，能够支持比当前GPU运行的纹理分辨率高出四倍的纹理。

目前，RTX NTC技术仍处于测试阶段，尚未确定发布日期。有趣的是，其最低硬件要求似乎并不高。英伟达在GitHub上的RTX NTC页面确认，最低GPU要求是RTX 20系列显卡。此外，该技术还已在GTX 10系列显卡、AMD Radeon RX 6000系列显卡以及Arc A系列显卡上得到验证，这意味着未来该技术有望在非RTX显卡甚至游戏主机上得到广泛应用。

前一篇：

后一篇：