影驰 RTX 4090 金属大师 OC 评测:硬朗金属装甲,简约亦有性能

时间:2022-10-12 20:48:14       来源:搜狐号-IT之家

RTX 4090 作为 NVIDIA 首发的年度旗舰,各个 AIC 厂商肯定会铆足了劲把自家所有的黑科技都堆上去。但这就往往会导致高溢价和设计冗余。而影驰这边首发的 RTX 4090 金属大师 OC 却深得我心。它整体设计风格简洁硬朗,又保证了强劲的散热,可谓是 RTX 4090 首发序列中的一股清流。


(资料图片仅供参考)

IT之家提前收到了影驰 RTX 4090 金属大师 OC,在本次测试中,我们将全部配置拉满,尽量避免对这块性能怪兽形成瓶颈。具体配置如下:

外观设计

影驰 RTX 4090 金属大师 OC 显卡采用 METALTOP 系列银白风格包装,包装正面印有以金属器械拼构而成的金属大师 Logo,RTX 4090 的产品型号,还注明了提供 3 年质保,并支持个人送保。

包装内有显卡本体,12VHPWR 转 4*8Pin 延长线缆以及一组显卡支撑杆套件。RTX 4090 由于散热的升级,整张卡也变成了占据三槽半的巨型显卡,因此横装显卡时一定要用支撑杆顶一下,不然在搬动时可能导致挡板被掰弯。

影驰 RTX 4090 金属大师 OC 显卡采用三风扇设计,显卡外部包裹有一圈银白色金属材质装甲,边缘采用 CNC 工艺,表面布满了条形纹路。

风扇本体为黑色,中间印有白色的金属大师 Logo,风扇直径 102mm,厚 20mm,11 片扇叶设计,扇叶的 3 段式结构是金属大师系列特色,且支持智能启停功能。

影驰 RTX 4090 金属大师 OC 显卡背板采用灰色拉丝金属设计,周围有一圈银白色点缀。背板图案左右对称,右侧为镂空散热开孔。

通过镂空散热开孔,可看到内部的散热鳍片。

正侧边和右侧边同样有镂空散热开孔。影驰 RTX 4090 金属大师 OC 显卡采用寒光星 δ(德尔塔)散热系统,配备 4*Φ8mm+4*Φ6mm 镀镍复合热管,大面积均热板和 6 组散热鳍片。

影驰 RTX 4090 金属大师 OC 显卡的正侧面有三个镂空散热口,左右分别印有 Geforce 和 GALAX 标识。

中间的散热开孔上方还有一组 16pin 接口,这个接口目前大部分电源都没有,所以需要通过包装内附带的 4 个 8Pin 接口转成这一个 16pin 接口。

I / O 挡板部分配备了 3*DP1.4 接口和 1*HDMI2.1 接口,支持最高 8K 视频输出,上下各有三枚螺丝进行固定。

规格解析

影驰 RTX 4090 金属大师 OC 是基于目前 NVIDIA 最高端的 AD102 核心打造的,内有 16384 个 CUDA 核心、512 个 Tensor 核心、128 个光追核心、512 个纹理单元、176 个 ROP 单元,比上一代 RTX 3090 核心规模大了一半还多。

影驰 RTX 4090 金属大师 OC 的核心频率是 2235-2565MHz,比公版要略微高一点点。显存方面是 384-bit 的 24GB GDDR6X,但频率达到了等效 21Gbps,带宽提升到了 1TB / s。TDP 为 450W,达到了 RTX 3090 Ti 的档次,相比于 RTX 3090 增加了整整 100W,建议搭配 850W 以上的电源。

‏RTX 4090 的架构也发生了不小的变化,它升级到了最新的 NVIDIA Ada Lovelace 架构。它基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。特别是在 AI 能力和光线追踪能力上有了巨大的突破。反映到具体的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。同时支持双 AV1 编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。‏

‏理论性能‏

‏ ‏

‏那么影驰 RTX 4090 金属大师 OC 相比于公版 RTX 4090 会在理论性能上有多大的进步呢?接下来我们进行理论测试,首先是单烤甜甜圈,烤机 15 分钟后,核心温度稳定在 67.2℃左右,功耗稳定在 445W 左右,这个功耗和散热表现与公版 RTX 4090 是基本一致的。风扇也远没有满载,使用起来比公版的双风扇更加安静。‏

‏接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测‏影驰 RTX 4090 金属大师 OC‏的得分为 99.6%,是我们目前测的 RTX 4090 显卡中最高的。‏

‏在 3DMark TimeSpy DX12 测试中‏影驰 RTX 4090 金属大师 OC‏显卡分数达到了 35280 分,比公版的 34720 分略高一些。看来默认提升的一些频率还是起到了作用。‏

‏在 3DMark Fire Strike DX11 测试中,‏影驰 RTX 4090 金属大师 OC‏显卡分数达到了 75605 分,同样比公版的 75013 分略高,这个分数意味着几乎可以 8K 分辨率流畅运行所有的游戏了,哪怕是 4K 光追游戏和 VR 游戏也能满足高刷新率的需求。‏

‏在 3DMark Portal Royal 光追测试中,‏影驰 RTX 4090 金属大师 OC‏获得了 25558 分,提升幅度比光栅性能来得更大。比 GeForce RTX 3090 几乎提升了一倍。过去 GeForce RTX 3090 可以在 2K 分辨率下流畅体验的光追游戏,RTX 4090 已经可以再在 4K 分辨率下畅玩了。‏

‏DLSS 3 详解‏

‏虽然理论性能提升了近 80%,但 NVIDIA 并不满足于此。发布会上最重磅的一个技术升级,便是 DLSS 3 技术了。DLSS 3 是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。‏

‏基于 NVIDIA Ada Lovelace 架构的光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而无需传统游戏引擎进行建模。多帧生成模型同时获取游戏引擎中的运动矢量和光流数据,这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。‏

‏简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。在实际使用中,DLSS 3 更适合把一个比较高的帧数补到更高的帧数。因此需要结合 DLSS 2 的超分辨率功能,把原来很低的帧数先变高,然后再用 DLSS 3 变得更高。一套操作下来 AI 能重建至多八分之七的像素。‏

‏口说无凭,我们直接进入测试环节。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把‏影驰 RTX 4090 金属大师 OC‏的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。实测在 DLSS 2 模式下,平均帧数为 131 帧,相比于不开 DLSS 2 已经提升了两倍多。‏

‏但如果我们开启最新的 DLSS 3 技术,帧数直接来到了平均 162 帧,比不开 DLSS 提升了 3 倍多,这个提升相当明显。‏

‏目前 DLSS 3 已经适配了不少新游戏,由于只要适配 DLSS 3 就可以向下兼容 DLSS 2,开发难度非常低,所有后续肯定会有越来越多开发商加入 DLSS 阵营。我们选取了《赛博朋克 2077》、《逆水寒》和《虚幻引擎 5:天琴座》这几款已经适配了 DLSS 3 的游戏和 Demo 来对‏影驰 RTX 4090 金属大师 OC‏进行测试。此外我们还会测试一款 Unity 引擎的 Demo《Enemies》。‏

‏首先是显卡杀手《赛博朋克 2077》,我们在 4K 最高画质超级光追‏档位下‏运行它自带的 BenchMark,得到了以下数据。可以看出 DLSS 3 的提升非常明显,在都开到超级性能档位的前提下,DLSS 3 比 DLSS 2 的帧数提升了 50%,比不开 DLSS 提升了 2.5 倍。‏

‏在国产武侠网游《逆水寒》中,同样提供 RTX 光线追踪和 DLSS 3 的选项。从下面的数据可以看出,DLSS 3 在《逆水寒》中的表现比《赛博朋克 2077》还要出彩。不开启 DLSS 几乎是不可玩的状态,而在开启 DLSS 3 后,帧率提高了近 5 倍。相比于同档位的 DLSS 2 也提升了近 65%。‏

‏在画质方面,我们选择了一处场景中的细节,可以看出 DLSS 确实会降低渲染分辨率,但在 4K 显示器这样的尺度来看,差别并不大。‏

‏↑ 左 DLSS 关闭 ,右 DLSS 3 平衡‏

‏接下来是一款使用虚幻 5 引擎制作的游戏 Demo《天琴座》。虚幻 5 引擎提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后续会有大量基于虚幻 5 引擎打造的 3A 大作上线(比如《黑神话:悟空》)。‏

‏DLSS 3 在《天琴座》中的表现同样符合预期。在开启 DLSS 3 后,帧率提高了近 1.7 倍。相比于同档位的 DLSS 2 也提升了近 20%。‏

‏除了虚幻引擎外,Unity 引擎也提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我们测试一款画质爆炸的 Demo《Unity:Enemies》。这款 Demo 就没有那么多档位可以选了,只能调整开关。‏影驰 RTX 4090 金属大师 OC‏在开启 DLSS 3 后,帧数暴涨了近 2.5 倍,4K 渲染丝般顺滑。‏

‏在画质方面,打开 DLSS 和关闭 DLSS 的清晰度之间差别其实不大,但能明显感觉到 DLSS 加持的画面会更锐一些。‏

‏↑ 左 DLSS 关闭 ,右 DLSS 3 开启‏

‏那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是 AI 生成全新帧,生成帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。‏

‏在新上线的《守望先锋》“归来”中,这个电竞延迟就显得格外重要了。即便是 4K 分辨率下,帧数甚至都可以跑到 600 帧的上限,高帧数就意味着延迟的降低,对于分秒必争的射击游戏来说更是如此。‏

‏同时《守望先锋》“归来”‏也‏支持 NVIDIA Reflex 低延迟,它使 CPU 能够在完成前一帧之前就开始向 GPU 提交渲染工作,从而大大减少甚至消除渲染队列,这使得响应时间更快,瞄准精度更高。‏

‏最后我们测试一款光追 3A 大作《控制》,4K 最高画质最高光追下不开 DLSS 只能勉强流畅游玩,而‏影驰 RTX 4090 金属大师 OC‏开启 DLSS 后帧数直接翻倍,这个体验相当出色了。‏

‏创意生产‏

影驰 RTX 4090 金属大师 OC 的作用并不局限于‏打游戏,创意生产和深度学习也是主要受众。如今 AI 绘画这么火爆,相比有不少极客们想拿 RTX 4090 来训练自己的 AI 吧。RTX 4090 也可以通过 NVIDIA Studio 对超过 75 款创意应用进行加速,来大大提高工作效率。‏

‏在建模渲染类软件中,RTX 4090 可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。‏

‏V-Ray CUDA Benchmark 的分数达到了惊人的 4411 分,比公版卡高了足足 200 分,创下了历史新高。‏

‏得益于光追性能的提升,‏影驰 RTX 4090 金属大师 OC‏在 V-Ray GPU RTX 中的分数也提高到了 5974 分,比公版 RTX 4090 高了 150 分,足以应对实时光追的重度渲染。‏

‏最后我们跑一下另外一款渲染软件 Octane,它可以藉由 RTX 加速的光线追踪和搭载 AI 的 OptiX 降噪可实现快速的交互式渲染。最终的测试结果来看,其渲染能力已经相当于至多 27 块 GTX 980 同时工作,比公版 RTX 4090 还要多一块,真是强到离谱。‏

‏在视频后期这一块,GeForce RTX 40 系列均配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。‏

‏NVIDIA 与多家行业合作伙伴密切合作,当今主流多媒体应用均可以支持 AV1。目前国内的剪映专业版已经支持 NVIDIA 的 AV1 的视频编码器加速。OBS 直播软件也支持了 NVENC 的 AV1 编码的录制,希望能尽快适配 AV1 编码的直播,大大节约直播带宽。‏

‏常用的视频调色剪辑软件 DaVinci 也提供了 AV1 编码的支持,作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。‏

‏IT之家为大家测试了 PugetBench For Davinci。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。‏影驰 RTX 4090 金属大师 OC‏最终分数可以达到 2623 分,比公版 RTX 4090 要略高一些些。‏

‏此外,NVIDIA 还为 RTX GPU 提供了 NVIDIA Broadcast 这个神器。它通过人工智能技术,实现了音频降噪、绿幕抠像、人像聚焦等实用效果。‏

‏现在笔者就在家里用一套简单的 USB 摄像头和麦克风进行直播,即便是只有这么一台电脑一个摄像头,但在 RTX GPU 的帮助下,便能在各类应用中选用 NVIDIA Broadcast 应用从而效果。‏

‏总结‏

‏作为一个极简主义者,笔者还是更喜欢影驰这样的设计风格。简约而不简单,放在任何机箱里都能很好的搭配。而在散热方面,它也实现了比公版更优的效果。虽然测试时间非常紧张,但笔者依旧被‏影驰 RTX 4090 金属大师 OC 的性能‏所震撼。它在 4K 分辨率下已经能满足高帧数 3A 的全部要求。如此强悍的性能,再加上 DLSS 3 的加持,即便是 8K 游戏的普及也是未来可期了。‏

如果你也喜欢这种极简硬朗的设计风格的话,那么影驰 RTX 4090 金属大师 OC 会是你非公版显卡的好选择。在上架之初不妨关注一下,相信在售价上也会有惊喜。

关键词: 金属大师 光线追踪