更新时间:2025-09-08 10:47:51 编辑:丁丁小编
来源:点击查看
简介
写在开头
虽然相关规定造成的波折甚多,但是NVIDIA还是为国内玩家带来了GeForce RTX 50系旗舰的又一个新版本GeForce RTX 5090 D v2。想必大家都已经看过相关的评测了,不过我们今天要上手的这张RTX 5090 D v2又有些不一样,它就是影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X,它隶属于名人堂系列,该系列被广大玩家称之为“旗舰中的旗舰”,专为追求极致性能的玩家量身打造。
规格介绍
开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。
相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。
第五代Tensor核心
其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。
第四代RT核心
而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。
综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。
第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。
该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。
另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。
GDDR7显存
第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。
神经网络着色器
接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。
在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。
这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。
目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。
而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。
另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。
这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。
先进的AI管理处理器
此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。
而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。
GeForce RTX 5090 D v2规格
说了这么多,接下来给大家介绍一下GeForce RTX 5090 D v2 24GB的硬件规格,其核心沿用了之前RTX 5090 D上的GB202芯片,不过核心代号改为GB202-240-A1。在架构上拥有10个完整的GPC以及1个非完整GPC,计算下来,就是GeForce RTX 5090 D v2上共有85个TPC,170个SM单元,21760个CUDA核心,规模与RTX 5090 D一致。另外二级缓存方面也没有变化,都为96MB。
在工艺制程方面,依旧是熟悉的TSMC 4nm 4N NVIDIA Custom Process工艺。核心频率也没有改变,GeForce RTX 5090 D v2 24GB与RTX 5090 D唯一的区别已经写在名字上了,就是显存规格的变化,目前GeForce RTX 5090 D v2配备的是GDDR7显存,显存等效频率可达28Gbps,但是容量为24GB,因此位宽也相应降低至384-bit,不过带宽依旧有1344GB/s,满足游戏玩家甚至是AIGC应用都不成问题。
最后是售价方面,GeForce RTX 5090 D v2的官方建议零售价依旧为16499元,感兴趣的玩家不妨关注一下,这可能是你在国内能够买到的最强性能且有质保的消费级显卡了,下面我们就给大家揭晓一下这张显卡的性能表现。
影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X外观赏析
影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的外包装依然沿袭了HOF家族风格设计,有双层包装。外包装采用镂空窗口设计,简洁且有质感,可以看到内部的HALL OF FAME金色字样。右下角则是显卡型号标注,为GEFORCE RTX 5090 D v2。
外包装的背面则是显卡技术的详细介绍,如影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X独有的HOF名人堂ARGB皇冠灯效、镀金显示接口、双BIOS功能等,让玩家更了解顶级卡皇的用料。
内包装则采用纯白加金色字样的设计,整体更显高级感,正面是名人堂HALL OF FAME的标识,下方还有ONLY FOR BETTER PERFORMANCE,翻译过来就是名人堂的Slogen——一切只为性能。
右上角以及左下角还分别标注了OC LAB EDITION以及EXTREME GAMING GRAPHICS CARD,每一个细节都彰显了这款显卡的不同。
打开礼盒式的包装以后,就能看到这张顶级卡皇的真面目了,有一说一,颇有种在开箱奢侈品的感觉。
礼盒内有多层设计,顶部是我们刚刚看到的显卡本体,下方则是附件,包括标准的显卡支架、和一根白色8pin*4转16pin转接线,还有一根5V ARGB灯光同步线以及HOF系列专属的黑色保护手套。
下面让一起欣赏一下影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的外观,整张显卡用的是纯白设计语言,显卡导风罩更是采用圣白切割棱面设计,搭配细腻烤漆工艺,尽显纯净高级质感。
另外,显卡正面可以看到大量的线条切割设计,勾勒出这张名人堂旗舰极具未来感的轮廓。不规则的棱角更是锦上添花的设计,当光从不同角度照去,能够折射出丰富的光影,层次感十足。绝对的高端气质,设计非常前卫。
正面还有三把经过特殊设计的霜环扇叶风扇,左右两边的是102mm,而中间的则是92mm。并且三把风扇均采用三折大扇叶结合环形链结构设计,这样的好处是能够优化气流导向,有效降低核心温度。
当然,智能风扇启停技术也不能少,当你在全力输出时,它们可以自动提升转速,保证核心散热,而当核心温度低于60度时,它们也会自动停转,让你享受安静的使用体验。
接着我们再来看看这个异常吸睛的“皇冠”,熟悉名人堂的玩家应该已经看出来了,这是HOF系列的经典性能象征,影驰将其打造为可拆式皇冠灯件,配合纯白的外观设计,尽显旗舰风范。
皇冠采用磁吸的连接方式,可以磁吸至显卡侧面,与显卡连为一体,也可与接入5V灯光线独立放置。上机以后可以实现多彩的RGB效果,文章后续的上机部分将会展示。
显卡背部延续了正面纯白的设计风格,采用高强度金属背板,有助于巩固显卡不易变型,而且金属背板还可提升散热效能。设计语言上,巨大的金色皇冠标识,旁边则是HOF OC LAB字样,简约之中但又透露出尊贵的气息。
显卡尾端则是单独开孔的散热设计,并且影驰将其打造成了HOF系列的皇冠造型,与背板的金色皇冠形成对称设计,非常巧妙。
并且这个镂空散热窗口还延伸至显卡侧边,不仅能够提升散热效能,也为显卡侧边增加了一丝点缀。
显卡顶部也非常值得说道,取下名人堂皇冠配件,可以看到下方是Hall Of Fame的灯带,一样能够实现五彩斑斓的RGB效果。
显卡配备的是12V-2×6接口,也就是我们常说的16pin外接供电接口,单口能够实现600W的超强供电能力。并且供电接口也配合显卡整体外观进行了白色化处理,细节好评。
在供电接口左侧,还有一个一键切换BIOS按键,分为两档选择,其中Gaming Mode为基础频率,OC Mode则为高频模式。
视线换到另一侧,显卡底部则是大面积的散热鳍片,另外,风扇的导风罩处还有名人堂的经典皇冠LOGO,辨识度这块属实是拉满了。
显卡底部还有PCIe 5.0金手指,这也是NVIDIA首次在显卡上应用,能够带来更高的传输速率,并且细看金手指的形状和上一代的显卡有些微的变化。
在视频输出接口上,这款显卡采用的是HDMI 2.1b*1 + DP2.1b*3的配置。其中DP 2.1b接口为UHBR20规格,可达 80Gbps 带宽,最高支持8K (7680x4320)@165Hz(DSC);4K (3840x2160)@480Hz(DSC)。并且所有视频输出接口都进行了镀金处理,可有效抗氧化,保障信号输出质量。
另外,眼尖的小伙伴应该发现了,在视频输出接口的旁边还有一个按钮,根据影驰介绍,这是HOF系列标志性的HyperBoost一键加速功能按钮,按下后能一键开启提高显卡风扇转速,散热效果史诗级增强!
影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X上机演示
下面给大家看看影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的上机效果,整体颜值还是非常吸睛的。
显卡共有多达数十种灯光效果,上机后默认色彩循环,可至影驰官网下载HOF AI软件进行调节。
灯光整体的色彩饱和度很高,色彩均衡,还原效果也非常好,尤为适合白色主题装机。
显卡背板上还有类似铭牌的HOF标识灯牌,其一样支持RGB灯效,亮灯的瞬间,高级感拉满。
并且外观部分我们也提到皇冠组件是可以单独取下的,取下以后连接主板亦可实现主板灯光同步,而显卡侧面的“HALL OF FAME”字样同样可以发光。
同时,这个皇冠灯效组件还支持除错检测,当显卡或主板沒有正确接电时,开机时皇冠灯效与风扇灯效会呈现红色或黄色。
影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X拆解介绍
下面我们一起看看这款显卡的内部用料,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的PCB采用12层高规格OC定制,并且使用的是HOF专属的白色PCB,电气性能更好。
PCB工艺上,这款显卡用的是沉金工艺设计,不仅传输更稳定,还能够提升抗氧化能力,让整块PCB的使用寿命更长。
PCB的中央是这块显卡的核心,其与之前的RTX 5090或RTX 5090 D没有区别,都是GB202核心,不过后缀代号稍有改变为GB202-240-KCD-A1,由TSMC 4nm 4N NVIDIA Custom Process工艺打造,内部有21760个CUDA核心,相比RTX 4090的16384个CUDA核心,提升了约30%左右。
显存方面采用12颗三星GDDR7显存颗粒,单颗显存2GB,等效频率28Gbps,显存位宽则是384-bit,与前代的RTX 4090保持同一水准。
供电配置才是这款显卡的重头戏,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X搭载 20+8+8 相数字供电。
每项供电都配备了独立的DrMos芯片,来自英飞凌,型号是PMC41410,最大支持70A大电流,并且全部自带温度和电流保护,稳定性更好。
另外,整个供电模组还采用了HOF高频电感,专供数字供电方案,拥有额定电流大、直流电阻小、工作转换损耗小及工作温度更低等特性。一旁还有松下POSCAP+黑金NICHICON全固态电容,能够实现小纹波高频运作等效串联电阻更小、频率响应更快、输出更稳定、超频更好、耐温更高,寿命更长等特性。
PWM控制芯片安排了两颗数字多相控制器,均来自英飞凌旗下,型号是XDPE1A2G7B,这是一颗双环路16相的控制器,规格相当之高。
PWM控制芯片的旁边是uS5650Q,用作电源监控。
PCB最右侧的GM009-B芯片则为ARGB灯光控制器。
物理供电接口则是大家都很熟悉的12V-2×6接口,最大可提供600W的供电能力。
并且在供电接口后方还有两颗HOF高频电感,能够过滤高频噪声并提升电流稳定性,为显卡在高负载运行时提供稳定的供电保障。
拆开显卡以后我们也能看到外观部分提到的镀金视频输出接口,能够防止氧化以及提供更稳定的视频输出效果。
下面再来看看这款显卡的散热结构,影驰称其为多维度散热模组,其包含散热器、铝合金中框件、散热风扇以及金属背板四部分。
散热器最显眼的就是大面积的100mm*92mm高性能均热板,散热效能不容小觑。除此之外,均热板的四周,显存、电感、MOS管接触的地方也都用上了高系数的导热垫辅助散热。
核心部分则是采用了用霍尼韦尔相变硅脂片,业界领先的导热效能和长效稳定性,确保
显卡散热效能可以长时间保持稳定高效。
整个散热器为左右两段式设计,由密密麻麻的鳍片覆盖,内部则是10根8mm复合热管的强效配置,散热效能绝对的一流。
另外,PCB与散热器之间还有一块特大压铸中框件,其采用铝合金材质打造,它不仅能够辅助散热,提升散热效能,还能加强巩固PCB的刚性。
主动散热部分则是我们外观环节提到的三把霜环扇叶风扇,规格为2×102mm+1×92mm,采用三折大扇叶的环形链结构。
扇叶也经过全新设计,由原来的11叶改善为7叶,可以实现同噪音下风压提升15%,同转速下噪音降低5%,风压提升10%,扇叶整体强度也得到了提升。
最后给大家看看拆解全家福,综合来看,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X无论是在外观设计,还是做工用料方面都十分舍得下本,不少用料都是旗舰甚至超旗舰的配置,确实不负顶级显卡之名。
测试平台介绍
开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U—— Ryzen R7-9800X3D,主板则是来自微星的MPG X870E CARBON WIFI 暗黑主板。内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-6000 C28的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。
完整测试平台配置如下:
理论性能测试
理论测试让我们关注一下GPU-Z,首先从GPU-Z的信息中可以看到OC Mode下影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的基准频率为2017MHz,Boost频率为2527MHz。频率设定非常激进,功耗墙设定也非常夸张,可以直接去到575W,另外显卡配备了PCIe 5.0接口,能够很好的应付未来的需求。
而在Gaming Mode下,这款显卡的基准频率不变,Boost频率则是2467MHz,有一说一,这个Boost频率依旧比不少别家的OC显卡还要高。
理论性能部分,我们用3DMark进行,在FireStrike系列测试中,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在4K分辨率下领先RTX 4090 D约52%,领先RTX 4090也有40%;而在以DX12为代表的Time Spy测试中,同样是4K分辨率,对比RTX 4090显卡强约36%,而对比RTX 4090 D则可以扩大至43%的性能领先。而对比RTX 5090 D的话,成绩可以说基本没有差别,二者在Fire Strike与Time Spy中的最大差距甚至只有2%,基本可以下结论,在显存容量足够的前提下,RTX 5090 D v2的游戏性能可视为与RTX 5090 D一致。
光追项目上,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X也依旧在T0水准,遥遥领先于RTX 4090,性能领先幅度高达52%,对比RTX 4090 D可以去到60%。而对比RTX 5090 D的话,最大性能差距也是控制在3%以内,一样能打。虽然由于众所周知的原因,不过从它的目前的性能表现来看,依旧是你在国内能够买到的最强显卡。
DLSS 4性能测试
看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。
而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。并且每次渲染额外帧只需要帧生成AI模型执行一次,就能输出三帧画面,因此无论是对性能、显存的开销还是延迟都比之前要好了许多。
另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。
同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。
不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,目前已经有超过125款游戏和应用支持DLSS 4多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》《黑神话:悟空》等。同时支持RTX技术的游戏与应用也已经超过800款,NVIDIA Reflex技术也在150款以上游戏中实现了支持,随着时间的推移,支持这些黑科技的游戏和应用数量将不断增加。
简单介绍完,我们再看看DLSS 4的理论表现如何,还是经典的3DMark测试。不得不说影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X搭配上DLSS 4以后,帧数就像放飞自我,再度实现了飞跃!其中2K分辨率下,开关前后性能差距超过3倍之多,4K分辨率就更夸张了,开关帧数差距接近6倍。另外24GB的显存依旧可以战8K,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X开启DLSS 4以后8K下能够实现240 FPS的表现,高刷级别的体验,依旧的T0水准。
接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着“显卡杀手”之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。
我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。
第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。
这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种“失真感”。
不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。
性能表现应该才是不少玩家关注的重点吧~在4K最高画质+路径追踪的情况下,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在不借助任何超分技术,成绩只有32 FPS,勉强能玩。开启DLSS 3性能档以后,游戏性能提升至164 FPS,已经能够很好的体验夜之城的魅力了。不过在开启DLSS 4以后,游戏帧数再度接近翻倍,288 FPS的表现直逼300大关,对比原生分辨率下,性能暴涨8倍以上。
DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。
第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。
总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。
接着我们继续测试一款对显卡压力巨大的国产3A大作——《黑神话:悟空》,去年发售时,这款游戏也是率先支持了DLSS 3帧生成功能,如今它还支持了RTX 50系显卡的DLSS 4多帧生成,游玩体验将会更加顺畅,开启方式也很简单,在游戏菜单设置中即可找到4X的选项。
我们直接将画质调整至影视级,全景光追也调至超高的水平。不得不说这款游戏对硬件的要求与《赛博朋克2077》不相上下,在4K分辨率下不开任何超分技术,游戏帧数仅有28 FPS,而有DLSS 3的帮助后,游戏帧数也回到了流畅的水准137 FPS,已经可以高刷玩3A了;这时如果你有影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X显卡,开启DLSS 4多帧生成以后,游戏帧数将再度飞跃,248 FPS的表现相当夸张,对比原生分辨率同样提升了8倍,跑满4K@240Hz的显示器不是梦。
我们测试的第三款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2相当于原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。
实际测试中,设定4K分辨率画质光追均设置最高,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在不开任何超分的情况下,平均帧为75 FPS。如果开启DLSS 3性能档,此时帧数已经能够做到170 FPS了,属于是高刷与画质的完美组合,体验相当丝滑。开启DLSS 4以后,帧数可以进一步提升至312 FPS,对比原生4K的表现,性能提升了约4倍左右。
第四款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持4X的选项,也就是DLSS 4多帧生成功能。
实测DLSS 4多帧生成还是非常实用的,在4K原生分辨率下,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X,不开超分玩就有121 FPS,妥妥的旗舰性能卡皇。而开启DLSS 4性能档以后,游戏平均帧直接暴增至394 FPS,游戏体验已经不能用丝滑来形容了,对比原生4K的表现,足足有3倍以上的提升。即便是对比DLSS 3的234 FPS,也是接近翻倍的帧数体验。
最后一款3A游戏我们测的是前段时间刚支持DLSS 4的《毁灭战士:黑暗时代》,实测影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在4K分辨率、超级噩梦画质下,表现还行,不开启超分,能够60 FPS流畅游戏;开启DLSS 3性能档后,游戏帧数已经能够满足高刷需求了,接着启动DLSS 4后,游戏帧数更是来到了257 FPS以上,完全的爽玩水准。
网游方面我们测的是《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。
实测影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在4K全高设置下,不开超分,帧数为109 FPS,甚至已经满足高刷的游戏需求了。开启DLSS 3后帧数可以达到288 FPS,相比原生分辨率已经提升接近三倍,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升4倍以上,470 FPS的表现完全不足以用流畅来形容,应该叫极致丝滑。同时延迟以及1%Low表现也非常出色,反应在游戏中会更加跟手,体感更佳。
总的来说,DLSS 4多帧生成功能的问世,毫无疑问为玩家带来了前所未有的游戏体验升级。与上一代RTX 40系的DLSS 3帧生成功能相比,它再次实现了帧数的惊人飞跃。特别是在影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X这种旗舰卡皇的加持下,游戏性能完全颠覆想象,以前想要4K稳定60 FPS游玩都有点吃力,现在4K高刷都不成问题!实际测试中,在上述几款游戏里,开启DLSS 4的影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X,帧数几乎是RTX 4090的两倍甚至更多!即便是对比RTX 5090 D,二者在压力非常大的《黑神话:悟空》里也只有6%左右的差距,反映到帧数的话,差距只有7帧,几乎可以看作是一致的表现。
另外,值得一提的是,除DLSS 4技术之外,全新的NVIDIA Reflex 2技术也即将发布。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。
为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过150款游戏中,可以将PC延迟降低50%。
而GeForce RTX 50系显卡再度升级,可支持 NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。
另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。
而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是未来NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。
目前,《THE FINALS》以及《无畏契约》已宣布即将支持NVIDIA Reflex 2技术。
游戏性能测试
见证了DLSS 4的出色游戏表现以后,下面我们要测试的是常规的游戏以及支持DLSS 3的游戏性能。
首先是3DMark的DLSS 3性能测试。影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在2K分辨率下,对比上代老大哥RTX 4090,性能提升幅度非常夸张,达到了42%,对比RTX 4090 D则是49%;4K分辨率下,开启DLSS 3以后,对比RTX 4090性能领先也基本维持在40%以上,而对比RTX 4090 D同样拉开了不小的差距,50%的性能提升还是非常惊艳的。当然,有玩家关心的与RTX 5090D 差别如何?这里也可以看到,即便是8K分辨率,两张显卡的差距只有5%,反应到帧数上面,差距就只剩5帧不到,几乎也是肉眼无法区分的级别了。
实际游戏表现又如何呢?这里我们选取了11款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分如有则采用最高。
实测结果与上面的理论测试基本相符,在4K分辨率下,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X能够全高设置流畅运行各种3A大作,对比RTX 4090强约30%,如果对比RTX 4090 D的话,性能领先幅度则可以扩大至40%以上。而面对RTX 5090 D,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在大部分游戏里的表现基本持平RTX 5090 D。总的来说,现阶段24GB显存足以应付市面上大部分游戏的原生4K分辨率使用情景,玩家大可不必有性能焦虑。
图像视频创作性能测试
游戏测完,下面就来看一下创作者们关心的生产力性能,首先是最基础的办公软件测试,大家完全不用担心影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的表现,实测四款显卡都是旗舰级的水准,性能差距都在伯仲之间。
想要分出它们的性能高低,自然得上压力更大的UL Procyon图像和视频编辑基准测试。实测影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X相比RTX 4090或RTX 4090 D提升不小。特别是在视频编辑部分,领先幅度可以高达24%,究其原因还是因为这一代RTX 50系再度对编码器进行了升级,不仅数量更多,支持的格式也更丰富。同时在图里也能看到影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X与RTX 5090 D的性能差距仅在1%-2%之间。
我们还用Adobe以及达芬奇的Benchmark项目进行了更详细的测试,这里的结果也能反映RTX 50系的全新编解码器还是有点东西的,例如在达芬奇的测试中,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X分别领先RTX 4090以及RTX 4090 D约33%,PR中也可以领先12%左右。当然,大显存在剪辑8K视频方面还是有优势的,例如更大的RTX 5090 D会稍微领先一些,不过差距也仅5%左右。
3D渲染创作性能测试
看完了图像视频方面的创作,我们再把目光投向3D渲染以及工业领域的软件中,看看RTX 50系显卡又有怎样的精彩表现。首先出场的还是我们熟悉的朋友Blender以及V-Ray,在这两款软件中,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X还是非常能打的,在Blender中每一项都能领先上代显卡20%左右,而在V-Ray里部分场景甚至可以领先至40%。不过这两款软件对显存内存的开销要求都比较高,因此RTX 5090 D更大的显存在这里会更占优势一些。
再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。
实测在开启DLSS 4以后,整个渲染预览的界面变得丝滑流畅,使用影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X进行预览模型时,帧数基本都在240 FPS以上,这还是在4K分辨率下,效果非常显著,并且其表现与RTX 5090 D基本相当。至于对比不开DLSS时的性能表现,那DLSS 4可以称得上是黑科技了,DLSS 4的性能几乎是原生的4倍,是DLSS 3的2倍。
工业领域我们用的是最新的SPECviewperf 15进行测试,最新版本引入了对最新图形 API 的支持,包括 DirectX 12 和 Vulkan,并具有反映新兴行业用例的工作负载。凭借这些增强功能,SPECviewperf 15 使用户能够准确评估其首选应用程序的最新版本在当前一代硬件上的性能表现。实测影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X对比RTX 4090或RTX 4090 D有不小的领先优势,部分项目如enscape-01,提升幅度甚至接近100%。 另外,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在大部分项目里的表现也与RTX 5090 D一致,玩家大可放心选购。
NVIDIA编解码测试
接下来的测试则是介绍RTX 50系显卡的编解码器,这也是新一代显卡在多媒体处理能力上的重要里程碑。GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。
这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。在同一段素材下,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X显卡导出这三段视频所需的时间分别为9秒、9秒以及14秒。与两张前代显卡相比,RTX 5090 D v2的导出效率最高能够提升了3倍。这个效率还是非常夸张的,能为视频创作者带来实实在在的时间成本节约与工作效率的显著提升。并且我们也跟之前推出的RTX 5090 D进行了对比,二者的编解码效率没有区别,玩家大可放心。
同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在同码率下画质相比H.265或H.264会更加出色,无论是在文字、人像还是建筑等画面里,AV1编码的的画质都有不小的优势,线条更锐利,暗部细节也更清晰。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。
值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间也仅需10秒,而RTX 40系显卡则不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。
4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。
AI性能测试
测试当然少不了AI环节,首先我们看看影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在Stable Diffusion中的表现如何,我们使用UL Procyon进行文生图测试,在比较轻松的SD 1.5里, 几款显卡的速度可以说是不分伯仲,几乎都能做到1秒1张图的速度。而在压力比较大的SDXL中,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的优势则非常明显,生成一张图的速度为7.132秒,领先RTX 4090 D约13%,与RTX 5090 D也几乎在同一水平线上。
紧接着,我们又用ComfyUI进行压力更大的测试,首先试了FLUX.1 Dev生成10张1024×1024图片,实测影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X能够做到5.53 s/it,对比RTX 4090以及RTX 4090 D分别快了10%以及20%,不过稍微落后于RTX 5090 D的4.7 s/it。而在生成视频方面,新架构带来的优势也非常明显,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X能够在图生视频中领先RTX 4090 D约52%,提升幅度非常惊人。但是毕竟这类项目对显存的要求还是有一定水准的,所以其性能还是不及更大显存的RTX 5090 D。
接着是本地大模型部署测试,我们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份不同长度文本进行总结摘要。实测影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的表现同样可圈可点,对比前代的两款显卡的性能领先有20%左右。但是还是一样的问题,参数量越大的大模型对显存要求也越高,因此影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的表现会比RTX 5090 D弱一些。
UL Procyon的AI Text Generation测试也是一样的情况,在实际测试中,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的性能表现在RTX 40系面前绝对是傲视群雄,能够轻松领先前代显卡约17-19%,不过会落后RTX 5090 D大概10%左右。
HOF AI软件与超频体验
下面到了玩家最感兴趣的环节了,作为旗舰中的旗舰系列,手持影驰GeForce RTX 5080 HOF OC LAB Deluxe-X怎能不超频。下面我们使用影驰官网下载的HOF AI软件进行简单尝试。
有一说一,影驰HOF AI软件还是非常丰富的,首先在灯光调节选项中就可以看到多达数十种的灯光效果,如色彩循环、波浪、流星雨,甚至还有红蓝警灯的效果,并且灯光可分为关闭或3级亮度调节。并且还提供了色盘,让玩家可以自定义色彩,玩法非常丰富。
当然,自定义风扇转速也是必不可少的一项功能,玩家在这里可以自定义风扇转速曲线,无论你是想满速释放还是静谧稳定,它都能满足你的需求。
而在超频界面,这才是极客玩家的主战场,这里可以自定义显卡的电压、温度墙,还可以进一步提升显卡的核心频率与显存频率,使显卡实现更高的性能释放。我们手上的这款影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在默认OC Mode状态下,Speed Way得分为14325,软件内显示的显卡核心频率为2790MHz
在HOF AI软件中,我们将其核心频率提升了300MHz后再度测试了3D Mark的Speey Way项目,其也从默认OC Mode下的14325分提升至目前的14527分,不过这应该还不是这款显卡的极限,如果你是极客玩家,它还能进一步压榨性能。
功耗与温度表现
最后一项测试烤机,这也是许多玩家关注的重点,Furmark烧机20分钟后,得益于影驰专为HOF系列打造的多维度散热模组,这款显卡的温度表现还是非常亮眼的。影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X在OC Mode下的核心温度稳定在70.2度,显存温度则是72度,此时显卡的最大功率为573.8W,核心频率则是2722MHz。
我们还在Gaming Mode下进行了烤机测试,其温度与OC Mode下几乎没有差别,核心温度稳定在70.7度,显存温度则是相同的72度,不过频率稍微低一些,为2707MHz。
横向对比RTX 4090或RTX 4090 D时可以看到,虽然影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的烤机功耗比较高,但是核心与显存的温度控制得确实不错,无论是重负载还是待机时的温度都与之前的显卡几乎维持在同一水平,足见影驰打造的多维度散热模组的含金量。
评测总结
总的来说,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X的表现还是符合预期的,不论是从外观设计、硬件堆料、散热效能还是做工水准来说,都称得上是顶级非公,并且得益于全新的Blackwell架构、DLSS 4、RTX神经网络渲染等技术,让其在游戏和内容创作领域均表现出色。
在玩家最关心的游戏性能方面,首先可以下结论,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X依旧是站在第一梯队的存在,轻松驾驭4K超高刷新率乃至8K游戏完全不成问题。从规格上也能看出来,毕竟GB202-240与GB202-250没有本质上的差别,而24GB显存也完全能够应付当下的游戏需求,加上这款显卡还有DLSS 4这样的黑科技加持,实测其游戏性能对比4K原生能够提升超8倍,甚至是对比RTX 5090 D来说,两张显卡的游戏性能也几乎没有差别,因此玩家大可放心选购。
至于AI与生产力方面,在我们的测试中,影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X面对前代显卡还是有不小的优势的,不少玩家可能认为显存减少了,其可能就与RTX 4090差不了多少了,实际并非如此。不过考虑到它比RTX 5090 D减少了8GB显存,它的表现还是不及RTX 5090 D强势的,差距主要在一些参数较大的大模型运行方面,而主流玩家常用的AI生图测试表现则相当不错,和RTX 5090 D很接近。如果你是40系用户,想要体验更强的AI创作性能,那影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X确实值得信赖。
最后聊聊选购建议,目前这款显卡已经在影驰各大电商平台正式开售,定价18999元。虽然规格被削弱,不过性能倒是不减,并且依然是目前中国大陆地区能买到的最强显卡。同时这款显卡还享受影驰三年半质保与个人送保服务,实现售后无忧。最近有装机需求的小伙伴,不妨可以这张顶级旗舰影驰GeForce RTX 5090 D v2 HOF OC LAB Plus-X显卡。