【IT之家评测室】技嘉 GeForce RTX 5080 GAMING OC 16G 评测:DLSS 4 技术加持,4K 游戏帧帧丝滑
在 CES 2025 展会上,英伟达发布了基于 Blackwell 架构的 GeForce RTX 50 系列游戏显卡。IT之家获得了技嘉 GeForce RTX 5080 GAMING OC 16G。这款显卡采用了全新的 Blackwell 架构,具备 GDDR7 256Bit 显存,容量高达 16GB,支持 DLSS 4 技术,显著提升了游戏帧率。此外,其风之力散热系统在解热性能方面优于公版,能够充分释放 RTX 5080 的性能。
为了发挥技嘉 RTX 5080 魔鹰的最佳性能,以下是我们的测试平台具体配置:
一、外观设计
技嘉 GeForce RTX 5080 GAMING OC 16G 采用全黑的外观设计,风之力散热系统装配三枚大型仿生散热风扇,其造型灵感来自鹰的翅膀,更符合空气动力学,减少风阻和噪音,同时风压提升可达 53.6%,风量也提高了 12.5%。
技嘉魔鹰 RTX 5080 背部采用镂空设计,用户通过网格可见风之力散热系统的散热鳍片,黑色线条涂装更显科技感。
根据 IT 之家测得的数据,技嘉魔鹰 RTX 5080 显卡的尺寸为 330*128*69mm(不含金手指与挡片),整卡重量约为 1.84kg。
技嘉魔鹰 RTX 5080 在右侧保留了显卡支架的三个孔位,用户可用两个即可稳定卡片。
该显卡顶部设有大量散热鳍片,左侧印有 GEFORCE RTX LOGO,右侧为支持滑动的 GIGABYTE LOGO,辅以 RGB 灯条照明。
技嘉魔鹰 RTX 5080 的供电接口带有指示灯功能,灯熄灭表示电源线连接正常,亮起表示未连接,闪烁则表示电源异常。这种设计能够防止因电源连接不良或忽略连接而导致显卡故障。
技嘉魔鹰 RTX 5080 除了一根转接线 3*8pin 外,附送显卡支架,支架支撑部分提供两种尺寸,以适应不同机箱需求。
在 I/O 金属挡板上,技嘉 GeForce RTX 5080 GAMING OC 16G 设有 3 个 DP2.1b 接口和 1 个 HDMI2.1b 接口,支持最高 8K / 165Hz 的输出。
二、技术解析
NVIDIA GeForce RTX 5080 采用全新的 Blackwell 架构,在游戏性能及 AI 性能上均取得显著提升。英伟达认为,现阶段用户对画面质量的追求已远远超越摩尔定律的预期,因此引入神经网络渲染技术以提高帧率,进而满足用户对画质和帧率的高需求。
得益于神经网络渲染的应用,Blackwell 的多流处理器(SM)实现了处理性能的提升,并与 Tensor Core 的结合愈加紧密,该优化有效提升了神经网络着色器的性能。
为确保下一代 DLSS 多帧生成技术下的帧率稳定性,Blackwell 架构特别引入了基于硬件的 Flip Metering。这项技术将帧率逻辑转移至显示引擎内,使 GPU 能够更准确地掌控显示时间,显示引擎的像素处理能力也得以翻倍提升,进一步支持更高分辨率及刷新率,释放 DLSS 4 的性能潜力。
第五代 Tensor Core 承载 FP4 浮点运算精度的支持,这种低量化方法类似于文件压缩,能够减少模型推理的数据存储及计算量,在显存使用上大幅降低至 FP16 的一半,但GPU 性能却可提升 2 倍。
RT Core 的功能提升了光线追踪、路径以及三角形交集的检测效率,能够精准处理大量几何细节。在新一代 Blackwell 架构下,检测效率达到了上一代的 2 倍,初代 Turing 架构的 8 倍,且通过增强压缩减少 25% 的内存占用,显著提升光线追踪效果。
搭载 GDDR7 显存的 Blackwell 架构 GPU,采用 PAM3 信号编码机制,相较于 GDDR6、GDDR6X,每两个周期传输 3 位数据,具备更低的功耗和更高的带宽,速度可达 30Gbps。
具体产品规格方面,技嘉 GeForce RTX 5080 GAMING OC 16G 基于最新的 GB200-400-A1 核心及 TSMC 4N 制程工艺,拥有 10752 个 CUDA 核心、336 个 Tensor 核心、84 个光追核心、336 个纹理单元、128 个 ROP 单元,与 RTX 4080 相比核心规模提升了约 10.5%,同时 SM 和 TPC 群组数量也增加,核心频率范围为 2.3Hz-2.62GHz。显存方面,升级至 256-bit 16GB GDDR7,带宽达 960GB/s,TGP 功耗为 360W,相较前代 RTX 4080 增加了 40W。
三、理论跑分
作为高端显卡,GeForce RTX 5080 的性能表现如何呢?接下来将进入理论测试环节。首先是烤机测试,连续运行甜甜圈 10 分钟,GPU 的核心温度稳定在 63.5℃,显著低于公版的 73.4°C,显卡频率为 2600MHz,功率约为 360W,符合英伟达官方的 TGP 标准。搭配 i7/i9 或锐龙 7、9 等高端处理器,1000W 的电源就绰绰有余。
在 3DMark Time Spy DX12 测试中,技嘉 GeForce RTX 5080 GAMING OC 16G 取得了 33159 分,较公版的 32022 高出一千多分。相较而言,公版 RTX 4080 分数为 29220,提升幅度达到约 13%,表现较为优异。
在 3D Mark Time Spy Extreme DX12 测试中,技嘉 GeForce RTX 5080 GAMING OC 16G 的分数达到了 16448,相较于公版 RTX 4080 的 14541,提升同样为 13%。
在 3DMark Portal Royal 实时光追测试中,技嘉 GeForce RTX 5080 GAMING OC 16G 综合得分达到 22587,相对 RTX 5080 公版的 22060,及 RTX 4080 公版的 18439,提升达到了 22%。
通过 3D Mark 的测试项目可见,技嘉 GeForce RTX 5080 GAMING OC 16G 在图形性能上相比公版 RTX 5080 有所提升,相比 RTX 4080 各项测试均提高了 13%-22% 左右。
四、游戏实测
本次游戏实测稍有不同,尽管 NVIDIA 宣称首批支持 DLSS 4 的游戏多达 75 款,目前想要顺利开启 DLSS 4 选项仍需通过 Steam 的测试版通道激活,所以大多数主流游戏我们继续测试 DLSS 3 和帧生成并在最后利用《赛博朋克:2077》单独呈现 DLSS 4 技术的实际效果。
1、《CS2》
首先来看《CS2》,与《CS:GO》相比,这款游戏对性能的要求增强,但技嘉 GeForce RTX 5080 GAMING OC 16G 仍在 4K 分辨率 + 高画质下取得了 298 帧的游戏平均帧数,1% Low 帧数为 137.6。
在 2K 分辨率 + 高画质下,游戏平均帧数提升至 490.8 帧,1% Low 帆数达到 235.8,确保了游戏的流畅运行。
2、《永劫无间》
在竞技游戏方面,我们选择了《永劫无间》和《漫威争锋》,《永劫无间》已经支持 DLSS 和帧生成技术,测试包括了 4K 和 2K 的帧率表现。在 4K 分辨率 + 高画质 + DLSS 质量档 + 帧生成 / 低延迟下,游戏平均帧数达到了 148 帧,1% Low 帧数为 100 帧,游戏延迟为 28ms;
在 2K 分辨率 + 高画质 + DLSS 质量档 + 帧生成 / 低延迟下,游戏平均帧数达到了 217 帧,延迟降低至 20ms。
3、《无限暖暖》
接下来是《无限暖暖》,这款游戏拥有出色的优化,开启光追后对硬件资源需求巨大,可与大型 3A 大作相媲美。
在 4K 分辨率 + 极致画质 + 上采样抗锯齿情况下,游戏平均帧数为 114 帧,1% Low 帧数为 92 帧;
在 4K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 107 帧,1% Low 帧数为 80 帧。
整体表现接近上一代卡皇 RTX 4090 的帧数,游戏明显更流畅,操作体验更佳。
在 2K 分辨率 + 极致画质 + 上采样抗锯齿条件下,游戏平均帧数为 159 帧,1% Low 帧数为 143 帧;
在 2K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 155 帧,1% Low 帧数为 95 帧;
4、《古墓丽影:暗影》
在非光追和 DLSS 场景下测试 RTX 5080 的性能。
在 4K 分辨率 + 最高画质下,游戏平均帧数为 152 帧;
在 2K 分辨率 + 最高画质下,游戏平均帧数为 279 帧;
5、《极限竞速:地平线 5
《极限竞速:地平线 5》优化表现良好:
在 4K 分辨率 + 极致画质下,游戏平均帧数为 157 帧,1% Low 帧数为 129 帧;
在 2K 分辨率 + 极致画质下,游戏平均帧数为 212 帧,1% Low 帧数为 149 帧。
与公版 RTX 4080s 相较,4K 和 2K 分辨率下的平均帧数提升分别达到了 23% 和 42%。
6、《孤岛惊魂 6
接下来进入光追游戏测试,通过《孤岛惊魂 6》,该游戏对 CPU 单核性能也有较高要求,支持光追及 DLSS。经过实测:
在 4K 分辨率 + 极高画质下,游戏平均帧数为 135 帧,1% Low 帧数为 121 帧;
在 4K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 118 帧,1% Low 帧数为 105 帧。
在 2K 分辨率 + 极高画质下,游戏平均帧数为 209 帧,1% Low 帧数为 191 帧;
在 2K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 181 帧,1% Low 帧数为 164 帧;
7、《黑神话:悟空
在众所瞩目的《黑神话:悟空》测试中:
在 4K 分辨率 + 影视级画质 + 30% 超采样分辨率 + 高全景光追下,游戏平均帧数为 83 帧;
在 4K 分辨率 + 影视级画质 + 30% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 126 帧。
通过 RTX 5080,4K 分辨率下的影视级画质可达到超过 120 帧的游戏体验,提升显著。
调整至2K分辨率后:
在 2K 分辨率 + 影视级画质 + 30% 超采样分辨率情况下,游戏平均帧数为 110 帧;
在 2K 分辨率 + 影视级画质 + 30% 超采样分辨率 + 高全景光追 + 帧生成情况下,游戏平均帧数为 160 帧。
8、《真三国无双:起源
最后,我们测试了一款刚上线的游戏《真三国无双:起源》,它恰巧属于支持 DLSS 4 的游戏之一,不过目前尚未激活 DLSS 4 的选项,只能观察 DLSS 3 的性能表现。
测试在 4K 分辨率 + 最高画质下,游戏平均帧数为 112 帧,1% Low 帧为 83 帧;
在 4K 分辨率 + 最高画质 + DLSS 质量 + 帧生成情况下,游戏平均帧数为 208 帧,1% Low 帧数为 116 帧;
作为一款优化出色的游戏,RTX 5080 即使在不开光追和 DLSS 选项的情况下,在 4K 分辨率下依然实现了较高的帧数,同时带来了极佳的割草体验。
五、DLSS 4游戏体验
实际上,RTX 40 系列支持的 DLSS 3 技术,已经展现出显著的游戏帧率提升。而 DLSS 4 技术在 DLSS 3 的基础上进一步挖掘了帧生成的潜能,运用革新的多帧生成技术,借助第五代 Tensor Core 的强大性能,能够为每一个渲染帧生成多达 3 个额外帧,有效提升游戏 FPS。
DLSS 4 可以与光线重建、超分辨率及 DLAA 等技术协同工作,最高可将游戏帧率提升至传统渲染方式的 8 倍。当玩家启用 DLSS 4 技术并搭配 RTX 5080 显卡时,能够轻松体验高帧率的 4K 光追游戏。
GeForce RTX 50 系列搭载的第五代 Tensor Core,在 AI 处理性能上较前代提升了 2.5 倍,显著降低游戏延迟,后续将展示延迟的实际变化。Blackwell 显示引擎直接影响 DLSS 4 技术,能够增强像素处理能力,有助于游戏在高分辨率和刷新率条件下适配 DLSS 4,最高可实现像素处理能力的翻倍。
DLSS 4技术实现了模型架构的突破性提升。DLSS 光线重建、超分辨率和 DLAA 同样由首个实时 Transformer 模型驱动,该模型致力于提高生成的像素质量。通过自注意力机制评估每帧画面中的每个像素重要性,从而更好地捕捉场景关系,生成的像素更加稳定、伪影更少,并在运动细节的表现上更丰富,边缘区域也变得更加平滑。
英伟达表示,目前已有超过 75 款游戏和应用支持 DLSS 帧生成技术,用户在 GeForce RTX 50 系列 GPU 上能够享受到 DLSS 多帧生成技术。随着 50 系显卡的正式发售,众多热门 3A 作品也将适配 DLSS 4,包括《心灵杀手 2》《夺宝奇兵:古老之圈》《真三国无双:起源》《黑神话:悟空》《星球大战:亡命之徒》和《寂静岭 2:重制版》等。
当前,Steam 测试版的《赛博朋克:2077》支持 DLSS 4,我们以此测试 DLSS 4 的实际体验。在 4K 分辨率 + 超级画质,未开启光追和 DLSS的情况下,游戏平均帧数表现良好,达到了 73.27 帧。
接着查看多帧生成选项,启动帧生成后,出现了一个多帧生成的倍率选择,可以选择 2x、3x 或 4x 这三种生成倍数。
在 4K 分辨率 + 超级光追画质 + DLSS 性能设置下,分别设置 2x、3x 和 4x 多帧生成进行基准测试,分别获得了 149.49 帧、206.15 帧和 255.69 帧的游戏平均帧数,2x 和 3x 的多帧生成表现接近 71.25 帧的 2 倍和 3 倍,超240 帧的超级光追画质体验超出预想,画面流畅感极佳。
在超速光追画质 + DLSS 4 多帧生成条件下,游戏平均帧数分别达到 106.3 帧、150.81 帧、189.68 帧。对于这款对硬件需求极高的 3A 游戏来说,我们体验到了前所未有的性能表现。可以说,DLSS 4 技术的投入使用,突破了过去对游戏性能的认知限制。
当然,任何形式的插帧都会导致不可避免的延迟增加,我们也测定了开关多帧生成选项的延迟。在关闭选项的情况下,测试 4K 超速光追画质的平均延迟为 33ms。随后在同一场景下,开启 2x、3x 及 4x 多帧生成,平均延迟分别为 41ms、44ms 和 49ms。
综合来看,尽管开启帧生成选项后延迟有所增加,但3x和4x的多帧生成延迟分别增加了 3ms 和 5ms,总体延迟都维持在 50ms 以内,这样的表现对于非竞技类单机游戏来说是完全可以接受的。
针对目前 DLSS 4 适配游戏数量不足的情况,英伟达推出了 DLSS Override 功能。这项功能可以让已支持 DLSS 的游戏在未适配 DLSS 4 时,依然能够体验 DLSS 4 的帧生成和超分辨率体验。
以《漫威争锋》为例,在 4K 分辨率 + 高画质 + 关闭 DLSS 的情况下,游戏平均帧数为 155 帧,1% Low 帧数为 63 帧,延迟为 15ms;
在 4K 分辨率 + 高画质 + DLSS 质量档下,平均帧数达 185 帧,1% Low 帧数为 107 帧,延迟提高至 25ms;
在相同设置下,启用 DLSS Override 并将 DLSS 4 帧生成设置为 X4,游戏平均帧数达到 372 帧,1% Low 帧数为 206 帧,延迟为 22ms。游戏帧率得到了显著提高,使用体验接近于原生支持 DLSS 4 的效果。
除了 DLSS 4 技术,NVIDIA Reflex 2 低延时技术进一步降低游戏延迟,提升操作体验。过去四年内,NVIDIA Reflex 已集成超过 100 款游戏,能够将 PC 延迟降低 50%。新 Reflex 2 引入了 Reflex Frame Warp 技术,通过同步鼠标输入与渲染帧,实时控制游戏帧,实现个性化低延迟设置。未来,NVIDIA Reflex 2 将支持《无畏契约》等主流竞技、动作类游戏,配合 DLSS 4,预计能显著提升游戏的低延时表现。
六、生产力
在生产力方面,IT之家测试了 UL Procyon 的照片编辑、视频剪辑、及 AI 文本撰写等性能表现。在照片编辑测试中,技嘉魔鹰 RTX 5080 配合 AMD 9800X3D 取得了 9369 分,优于公版 RTX 5080 的 683 分。
在视频剪辑性能测试中开启 GPU 加速,利用 RTX 5080 Blackwell 架构的第九代 NVENC,其在 H.264 / H.265 4:2:2 编码的 8 位及 10 位视频中表现极佳,结果为 63208 分,较公版 RTX 5080 提高 575 分。
终极大型语言模型测试中,面对 13B 参数量的 LLAMA 2 模型,平均 OTS 为 84.49 tokens/s,相比公版 RTX 5080 的 83.48 tokens/s 提升明显,表现卓越。
七、总结
经过此次对技嘉 GeForce RTX 5080 GAMING OC 16G 的首次测试,我们留下了深刻印象。尤其在第五代 Tensor Core 和 DLSS 4 技术的强力支持下,游戏性能得到了显著的提升,创建高帧数的游戏变得游刃有余。同时,其风之力散热系统表现出色,技嘉魔鹰 RTX 5080 搭配新一代仿生风扇,显著降低了风阻与噪音,能在保持低噪音的同时,风压提升达 53.6%,风量增加 12.5%,升级导热胶、大型均热板、复合式热管及进气格栅等散热技术,使产品的散热性能较公版 RTX 5080 更为优异。
关于技嘉 GeForce RTX 5080 GAMING OC 16G 的售价,目前尚无确切信息。同时,技嘉也推出了技嘉 GeForce RTX 5080 SFF 风魔 OC 显卡,搭载新一代仿生风扇,并符合 NVIDIA SFF-Ready 标准,适合小型机箱用户,售价为 8299 元,并与今日同步发售。
DLSS 4 技术的实施,为显卡游戏性能开启了崭新的篇章。一方面,玩家们将享受到更流畅而精彩的游戏体验;另一方面,游戏开发者也获得了更广阔的创作空间,能够创造出画面更为精美、运行更为流畅的游戏作品。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。