308人参与 • 2024-10-27 • 游戏引擎
在众所周知的原因推动下,想要以理想的价格买到geforce rtx 4090已然不太现实,所幸黄氏刀法着实精准,用geforce rtx 4090 d实现了合规与性能之间的新平衡点。并且由于没有founders edition版本,国内发售的重任落到了几家aic品牌上,作为nvidia好基友的索泰自然是其中之一。
手握geforce rtx 4090 d gpu的索泰自然不会闲着,索泰geforce rtx 4090 d pgf、索泰geforce rtx 4090 d amp airo、索泰geforce rtx 4090 d天启、索泰geforce rtx 4090 d trinity 月白上齐一套,其中索泰geforce rtx 4090 d trinity 月白不仅上架电商,在众友商定价中,也是颇具性价比的一款。
那么geforce rtx 4090 d的表现究竟如何?评测就此奉上。
与geforce rtx 4090所使用的ad102-300-a1不同,索泰geforce rtx 4090 d trinity 月白采用的gpu型号为ad102-250-a1。两款gpu均源自相同的ad102,并以此为基础向下屏蔽单元,实现不同的性能定位。
从整体上看,完整的ad102包含了12个图形处理集群(graphics processing clusters,gpc),72个纹理处理簇(texture processing clusters,tpc),144个流式多处理器(streaming multiprocessors,sm),以及搭配了12个32-bit控制器的显存接口,共计384-bit。
同时每个gpc独立使用1个光栅引擎(raster engine,re),6个tpc,2个光栅处理分区(raster operations partitions)。其中每个光栅处理分区包含8个光栅处理单元(raster operations,rop),因此总共16个rop。
每个tpc下包含2个流式多处理器(streaming multiprocessors,sm)。从maxwell架构开始,sm之下细分出了处理块(sub-core)概念,ad102中每个sm包含4个处理块,每个处理块包含1个64kb寄存器堆,1个l0指令缓存,1个warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(special function unit,sfu)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。包含16个专门用于fp32的cuda core,16个可以在fp32和int32之间切换的cuda core,因此共计32个cuda。
此外每个sm还包含1个第三代rt core,4个第四代tensor core,4个纹理单元(texture units),256kb寄存器堆,以及可根据需求进行配置的128kb l1共享缓存。
有意思的是,你会发现无论geforce rtx 4090还是geforce rtx 4090 d其实都没有用到完整的ad102核心,而是通过禁用gpc或者tpc的数量从而实现不同的定位。而geforce rtx 4090 d相当于在geforce rtx 4090的基础上再屏蔽1组gpc实现。
因此索泰geforce rtx 4090 d trinity 月白总共包含57个tpc,114个sm,14592个cuda core,456个第四代tensor core,114个第三代rt core。大致对比如下:
可以看到在显存配置和gpu频率上,geforce rtx 4090 d没有做出删减,同样保持了24gb gddr6x 384-bit显存,等效21gbps频率,1008gb/s的显存带宽。另外l2缓存容量也维持在了72mb,gpu频率2.52ghz。大容量显存和l2缓存的配置,都仍然能够给后续的游戏,特别是ai加速性能提供优秀的基础。
在72mb超大l2缓存的加持下,第三代rt core和第四代tenor core作为提升游戏特效性能的主力也有了更多的用武之地。其中,第三代rt core不仅可以通过l2缓存在路径追踪从中获得巨大收益,本身相对第二代rt core也提升了射线/三角形求交测试吞吐量,并引入透明度微图引擎(opacity micro-map,omm)和位移式微型网面引擎(displaced micro-mesh,dmm)。
第四代tenor core则是当下火热的dlss 3以及开始普及的dlss 3.5的重要组成部分。这是一套利用光流加速器实现像素级的测量,并通过云端的夜以继日的寻找提升高质量图像的途径,这使得gpu摆脱了渲染重建高分辨率方法,让渲染工作大幅度减少,以两帧为例,dlss 3会承担起第一帧的3/4的工作和第二帧的所有工作,实际上gpu只需要完成其中的1/8的渲染即可,从而节省了大量的计算资源。
而接下来的dlss 3.5则能同时包含dlss帧生成(fg)与光线重建(rr, ray reconstruction)技术搭配,再加上超分辨率(super resolution)、dlaa、帧生成(frame generation)多种技术融合。最终构建出一套高效的运行方式,但所有的前提都依靠第四代tenor core和光流加速器配合实现的。
此外,索泰geforce rtx 4090 d trinity 月白还包括第八代nvenc和第五代nvdec编解码器对媒体提供支持,从而在诸如av1编解码加速上获得更好的体验。
让我们把焦点放回显卡本身,索泰geforce rtx 4090 d trinity提供了月白和黑色两种颜色可选,在散热上主要选择了icestorm 3.0散热系统,优化了空气散热效能,并支持spectra 2.0 argb灯效。
其中icestorm 3.0散热系统提升了散热效能,提供了3个110mm的盾鳞2.0风扇,在提升扇叶面积的同时,也优化了每一片扇叶的曲率和鳞状仿生条纹,从而实现提升风扇风量、风压和风流的效果。
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论