欢迎来到世界集成电路协会官方网站!
世界集成電路協會
您的当前所在位置: 首页 行業要聞

英伟达 RTX 神经纹理压缩技术基准测试:最高可降低 96% 显存用量

发布时间:

来源:IT之家

2月9日消息,YouTube频道Compusemble对英伟达的RTX神经纹理压缩(NTC)技术进行了基准测试,展示了该技术在实际3D工作负载中的强大能力。测试结果显示,与传统纹理压缩技术相比,RTX NTC技术能够将纹理内存大小大幅降低96%。

1.jpg

IT之家注意到,Compusemble在RTX 4090显卡上分别以1440p和4K分辨率对NTC技术进行了测试。测试分为两种模式:“NTC转码为BCn”和“样本推理”。其中,“NTC转码为BCn”模式会在加载时将纹理转码为BCn格式;而“样本推理”模式则仅对渲染特定视图所需的单个texel进行解压缩,从而进一步减少纹理内存大小。

在1440p分辨率下,当启用DLSS超分功能时,“NTC转码为BCn”模式将测试应用的纹理内存占用从272MB降低至98MB,减少了64%。而“样本推理”模式则将纹理大小降至仅11.37MB,与非神经压缩技术相比,内存占用减少了95.8%,与之前的神经压缩模式相比减少了88%。

不过,启用RTX神经纹理压缩技术后,性能会受到一定影响。尽管如此,由于测试使用的是上一代RTX 4090显卡,而非最新的RTX 5090显卡,因此随着新一代架构的推出,性能损失可能会有所减少。

在“NTC转码为BCn”模式下,平均FPS与未启用NTC时相比几乎没有变化。而“样本推理”模式的性能下降最为明显,FPS从1600多帧的中等水平降至1500多帧的中等水平,1%的低值更是大幅降至840帧左右。

当使用TAA抗锯齿而非DLSS超分时,内存容量的减少情况与DLSS相同,但GPU的性能表现有所不同。三种模式的运行速度都明显快于DLSS,FPS接近2000帧。在“样本推理”模式下,1%的低值达到1300多帧,比840帧有了显著提升。

将分辨率提升至4K后,性能显著下降。启用DLSS超分功能时,“NTC转码为BCn”模式的平均FPS在1100帧左右,“样本推理”模式的平均FPS则略低于1000帧,两种模式的1%低值都在500帧左右。

而关闭DLSS,改用原生分辨率搭配TAA抗锯齿时,“NTC转码为BCn”模式的平均FPS提升至1700帧左右,“样本推理”模式的平均FPS在1500帧左右。前者的1%低值略低于1100帧,后者的1%低值略低于800帧。

此外,Compusemble还在4K分辨率下,针对“样本推理”模式测试了协同向量功能。启用协同向量时,平均帧率在1500帧左右;关闭协同向量时,平均FPS急剧下降至略低于650帧。1%的低值在启用协同向量时略低于750帧,关闭时略高于400帧。

Compusemble的基准测试表明,英伟达的神经压缩技术能够在大幅减少3D应用纹理内存占用的同时,以牺牲一定性能为代价,尤其是在“样本推理”模式下。

RTX神经纹理压缩技术已经开发了至少几年时间。这项新技术利用现代英伟达GPU中的张量核心来压缩3D应用和游戏纹理,而非传统的块截断编码。RTX NTC是自1990年代以来纹理压缩技术的首次重大升级,能够支持比当前GPU运行的纹理分辨率高出四倍的纹理。

目前,RTX NTC技术仍处于测试阶段,尚未确定发布日期。有趣的是,其最低硬件要求似乎并不高。英伟达在GitHub上的RTX NTC页面确认,最低GPU要求是RTX 20系列显卡。此外,该技术还已在GTX 10系列显卡、AMD Radeon RX 6000系列显卡以及Arc A系列显卡上得到验证,这意味着未来该技术有望在非RTX显卡甚至游戏主机上得到广泛应用。