RTX 4090 作为 NVIDIA 首发的年度旗舰,各个 AIC 厂商肯定会铆足了劲把自家所有的黑科技都堆上去。但这就往往会导致高溢价和设计冗余。而影驰这边首发的 RTX 4090 金属大师 OC 却深得我心。它整体设计风格简洁硬朗,又保证了强劲的散热,可谓是 RTX 4090 首发序列中的一股清流。
(资料图片仅供参考)
IT之家提前收到了影驰 RTX 4090 金属大师 OC,在本次测试中,我们将全部配置拉满,尽量避免对这块性能怪兽形成瓶颈。具体配置如下:
外观设计
影驰 RTX 4090 金属大师 OC 显卡采用 METALTOP 系列银白风格包装,包装正面印有以金属器械拼构而成的金属大师 Logo,RTX 4090 的产品型号,还注明了提供 3 年质保,并支持个人送保。
包装内有显卡本体,12VHPWR 转 4*8Pin 延长线缆以及一组显卡支撑杆套件。RTX 4090 由于散热的升级,整张卡也变成了占据三槽半的巨型显卡,因此横装显卡时一定要用支撑杆顶一下,不然在搬动时可能导致挡板被掰弯。
影驰 RTX 4090 金属大师 OC 显卡采用三风扇设计,显卡外部包裹有一圈银白色金属材质装甲,边缘采用 CNC 工艺,表面布满了条形纹路。
风扇本体为黑色,中间印有白色的金属大师 Logo,风扇直径 102mm,厚 20mm,11 片扇叶设计,扇叶的 3 段式结构是金属大师系列特色,且支持智能启停功能。
影驰 RTX 4090 金属大师 OC 显卡背板采用灰色拉丝金属设计,周围有一圈银白色点缀。背板图案左右对称,右侧为镂空散热开孔。
通过镂空散热开孔,可看到内部的散热鳍片。
正侧边和右侧边同样有镂空散热开孔。影驰 RTX 4090 金属大师 OC 显卡采用寒光星 δ(德尔塔)散热系统,配备 4*Φ8mm+4*Φ6mm 镀镍复合热管,大面积均热板和 6 组散热鳍片。
影驰 RTX 4090 金属大师 OC 显卡的正侧面有三个镂空散热口,左右分别印有 Geforce 和 GALAX 标识。
中间的散热开孔上方还有一组 16pin 接口,这个接口目前大部分电源都没有,所以需要通过包装内附带的 4 个 8Pin 接口转成这一个 16pin 接口。
I / O 挡板部分配备了 3*DP1.4 接口和 1*HDMI2.1 接口,支持最高 8K 视频输出,上下各有三枚螺丝进行固定。
规格解析
影驰 RTX 4090 金属大师 OC 是基于目前 NVIDIA 最高端的 AD102 核心打造的,内有 16384 个 CUDA 核心、512 个 Tensor 核心、128 个光追核心、512 个纹理单元、176 个 ROP 单元,比上一代 RTX 3090 核心规模大了一半还多。
影驰 RTX 4090 金属大师 OC 的核心频率是 2235-2565MHz,比公版要略微高一点点。显存方面是 384-bit 的 24GB GDDR6X,但频率达到了等效 21Gbps,带宽提升到了 1TB / s。TDP 为 450W,达到了 RTX 3090 Ti 的档次,相比于 RTX 3090 增加了整整 100W,建议搭配 850W 以上的电源。
RTX 4090 的架构也发生了不小的变化,它升级到了最新的 NVIDIA Ada Lovelace 架构。它基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。特别是在 AI 能力和光线追踪能力上有了巨大的突破。反映到具体的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。同时支持双 AV1 编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。
理论性能
那么影驰 RTX 4090 金属大师 OC 相比于公版 RTX 4090 会在理论性能上有多大的进步呢?接下来我们进行理论测试,首先是单烤甜甜圈,烤机 15 分钟后,核心温度稳定在 67.2℃左右,功耗稳定在 445W 左右,这个功耗和散热表现与公版 RTX 4090 是基本一致的。风扇也远没有满载,使用起来比公版的双风扇更加安静。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测影驰 RTX 4090 金属大师 OC的得分为 99.6%,是我们目前测的 RTX 4090 显卡中最高的。
在 3DMark TimeSpy DX12 测试中影驰 RTX 4090 金属大师 OC显卡分数达到了 35280 分,比公版的 34720 分略高一些。看来默认提升的一些频率还是起到了作用。
在 3DMark Fire Strike DX11 测试中,影驰 RTX 4090 金属大师 OC显卡分数达到了 75605 分,同样比公版的 75013 分略高,这个分数意味着几乎可以 8K 分辨率流畅运行所有的游戏了,哪怕是 4K 光追游戏和 VR 游戏也能满足高刷新率的需求。
在 3DMark Portal Royal 光追测试中,影驰 RTX 4090 金属大师 OC获得了 25558 分,提升幅度比光栅性能来得更大。比 GeForce RTX 3090 几乎提升了一倍。过去 GeForce RTX 3090 可以在 2K 分辨率下流畅体验的光追游戏,RTX 4090 已经可以再在 4K 分辨率下畅玩了。
DLSS 3 详解
虽然理论性能提升了近 80%,但 NVIDIA 并不满足于此。发布会上最重磅的一个技术升级,便是 DLSS 3 技术了。DLSS 3 是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
基于 NVIDIA Ada Lovelace 架构的光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而无需传统游戏引擎进行建模。多帧生成模型同时获取游戏引擎中的运动矢量和光流数据,这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。在实际使用中,DLSS 3 更适合把一个比较高的帧数补到更高的帧数。因此需要结合 DLSS 2 的超分辨率功能,把原来很低的帧数先变高,然后再用 DLSS 3 变得更高。一套操作下来 AI 能重建至多八分之七的像素。
口说无凭,我们直接进入测试环节。最新版的 3DMark 已经适配了 DLSS 3 的 BenchMark,我们把影驰 RTX 4090 金属大师 OC的测试结果和 DLSS 2 进行控制变量的对比,可以直观地看出差异。实测在 DLSS 2 模式下,平均帧数为 131 帧,相比于不开 DLSS 2 已经提升了两倍多。
但如果我们开启最新的 DLSS 3 技术,帧数直接来到了平均 162 帧,比不开 DLSS 提升了 3 倍多,这个提升相当明显。
目前 DLSS 3 已经适配了不少新游戏,由于只要适配 DLSS 3 就可以向下兼容 DLSS 2,开发难度非常低,所有后续肯定会有越来越多开发商加入 DLSS 阵营。我们选取了《赛博朋克 2077》、《逆水寒》和《虚幻引擎 5:天琴座》这几款已经适配了 DLSS 3 的游戏和 Demo 来对影驰 RTX 4090 金属大师 OC进行测试。此外我们还会测试一款 Unity 引擎的 Demo《Enemies》。
首先是显卡杀手《赛博朋克 2077》,我们在 4K 最高画质超级光追档位下运行它自带的 BenchMark,得到了以下数据。可以看出 DLSS 3 的提升非常明显,在都开到超级性能档位的前提下,DLSS 3 比 DLSS 2 的帧数提升了 50%,比不开 DLSS 提升了 2.5 倍。
在国产武侠网游《逆水寒》中,同样提供 RTX 光线追踪和 DLSS 3 的选项。从下面的数据可以看出,DLSS 3 在《逆水寒》中的表现比《赛博朋克 2077》还要出彩。不开启 DLSS 几乎是不可玩的状态,而在开启 DLSS 3 后,帧率提高了近 5 倍。相比于同档位的 DLSS 2 也提升了近 65%。
在画质方面,我们选择了一处场景中的细节,可以看出 DLSS 确实会降低渲染分辨率,但在 4K 显示器这样的尺度来看,差别并不大。
↑ 左 DLSS 关闭 ,右 DLSS 3 平衡
接下来是一款使用虚幻 5 引擎制作的游戏 Demo《天琴座》。虚幻 5 引擎提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后续会有大量基于虚幻 5 引擎打造的 3A 大作上线(比如《黑神话:悟空》)。
DLSS 3 在《天琴座》中的表现同样符合预期。在开启 DLSS 3 后,帧率提高了近 1.7 倍。相比于同档位的 DLSS 2 也提升了近 20%。
除了虚幻引擎外,Unity 引擎也提供了对 RTX 光线追踪、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我们测试一款画质爆炸的 Demo《Unity:Enemies》。这款 Demo 就没有那么多档位可以选了,只能调整开关。影驰 RTX 4090 金属大师 OC在开启 DLSS 3 后,帧数暴涨了近 2.5 倍,4K 渲染丝般顺滑。
在画质方面,打开 DLSS 和关闭 DLSS 的清晰度之间差别其实不大,但能明显感觉到 DLSS 加持的画面会更锐一些。
↑ 左 DLSS 关闭 ,右 DLSS 3 开启
那么 DLSS 3 技术就是十全十美的吗?当然不是。DLSS 3 的本质是 AI 生成全新帧,生成帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而 AI 却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。
在新上线的《守望先锋》“归来”中,这个电竞延迟就显得格外重要了。即便是 4K 分辨率下,帧数甚至都可以跑到 600 帧的上限,高帧数就意味着延迟的降低,对于分秒必争的射击游戏来说更是如此。
同时《守望先锋》“归来”也支持 NVIDIA Reflex 低延迟,它使 CPU 能够在完成前一帧之前就开始向 GPU 提交渲染工作,从而大大减少甚至消除渲染队列,这使得响应时间更快,瞄准精度更高。
最后我们测试一款光追 3A 大作《控制》,4K 最高画质最高光追下不开 DLSS 只能勉强流畅游玩,而影驰 RTX 4090 金属大师 OC开启 DLSS 后帧数直接翻倍,这个体验相当出色了。
创意生产
影驰 RTX 4090 金属大师 OC 的作用并不局限于打游戏,创意生产和深度学习也是主要受众。如今 AI 绘画这么火爆,相比有不少极客们想拿 RTX 4090 来训练自己的 AI 吧。RTX 4090 也可以通过 NVIDIA Studio 对超过 75 款创意应用进行加速,来大大提高工作效率。
在建模渲染类软件中,RTX 4090 可以利用 CUDA 为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
V-Ray CUDA Benchmark 的分数达到了惊人的 4411 分,比公版卡高了足足 200 分,创下了历史新高。
得益于光追性能的提升,影驰 RTX 4090 金属大师 OC在 V-Ray GPU RTX 中的分数也提高到了 5974 分,比公版 RTX 4090 高了 150 分,足以应对实时光追的重度渲染。
最后我们跑一下另外一款渲染软件 Octane,它可以藉由 RTX 加速的光线追踪和搭载 AI 的 OptiX 降噪可实现快速的交互式渲染。最终的测试结果来看,其渲染能力已经相当于至多 27 块 GTX 980 同时工作,比公版 RTX 4090 还要多一块,真是强到离谱。
在视频后期这一块,GeForce RTX 40 系列均配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。
NVIDIA 与多家行业合作伙伴密切合作,当今主流多媒体应用均可以支持 AV1。目前国内的剪映专业版已经支持 NVIDIA 的 AV1 的视频编码器加速。OBS 直播软件也支持了 NVENC 的 AV1 编码的录制,希望能尽快适配 AV1 编码的直播,大大节约直播带宽。
常用的视频调色剪辑软件 DaVinci 也提供了 AV1 编码的支持,作为一个免费开源的编码,后面会有越来越多的主流软件加入进来。
IT之家为大家测试了 PugetBench For Davinci。基于 NVIDIA CUDA 技术的 GPU 加速特效可实现更快速度的实时视频编辑和帧渲染,使用 NVIDIA 编码的输出速度提升最高可达 5 倍。影驰 RTX 4090 金属大师 OC最终分数可以达到 2623 分,比公版 RTX 4090 要略高一些些。
此外,NVIDIA 还为 RTX GPU 提供了 NVIDIA Broadcast 这个神器。它通过人工智能技术,实现了音频降噪、绿幕抠像、人像聚焦等实用效果。
现在笔者就在家里用一套简单的 USB 摄像头和麦克风进行直播,即便是只有这么一台电脑一个摄像头,但在 RTX GPU 的帮助下,便能在各类应用中选用 NVIDIA Broadcast 应用从而效果。
总结
作为一个极简主义者,笔者还是更喜欢影驰这样的设计风格。简约而不简单,放在任何机箱里都能很好的搭配。而在散热方面,它也实现了比公版更优的效果。虽然测试时间非常紧张,但笔者依旧被影驰 RTX 4090 金属大师 OC 的性能所震撼。它在 4K 分辨率下已经能满足高帧数 3A 的全部要求。如此强悍的性能,再加上 DLSS 3 的加持,即便是 8K 游戏的普及也是未来可期了。
如果你也喜欢这种极简硬朗的设计风格的话,那么影驰 RTX 4090 金属大师 OC 会是你非公版显卡的好选择。在上架之初不妨关注一下,相信在售价上也会有惊喜。