微星RTX 3060 Ti GAMING X TRIO怎么样 微星RTX 3060 Ti GAMING X TRIO评测
随着此次rtx 30系显卡60型号的发布,从入门到旗舰级产品已经补全,整体来看30系显卡有着非常恐怖的性能飞跃,即使是rtx 3060 ti这种甜品级显卡的性能都在rtx 2080 super,也就是上一代的准旗舰之上。今天为大家带来的是微星geforce rtx 3060 ti gaming x trio的评测,感兴趣的朋友不要错过了。
微星geforce rtx 3060 ti gaming x trio采用了nvidia ampere架构,相较于上一代的nvidia turing架构有什么不同呢?
第一代rtx架构 turing下的rtx 2060 super
第二代rtx架构 ampere下的rtx 3060 ti
相较于初代的turing rtx架构,nvidia ampere架构在算力上有着成倍的增长,这一点在rtx 3060 ti中依旧有体现,每个时钟执行2次着色器运算,而turing为1次,rtx 3060 ti的着色器性能达到16.2 tflops单精度性能,而turing为7.2 tflops。
nvidia ampere架构翻倍了光线与三角形的相交吞吐量,rt core达到31.6 rt tflops,而turing为21.7 rt tflops。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
例如最新发布的《赛博朋克2077》中,当玩家在游戏中遭遇赛车,追逐,打斗等激烈运动场景,第二代光追在架构上可以确保显卡渲染帧率相对更平稳,游戏体验上不会有频繁掉帧带来的顿挫感。
《赛博朋克2077》
全新的tensor core可自动识别并消除不太重要的dnn权重,处理稀疏网络的速率是turing的两倍,算力高达129.6 tensor tflops,而turing为57.4 tensor tflops。
芯片虽然决定了显卡的性能和规格,但是显卡工作的整体稳定性,温度表现,噪音等级却更依赖显卡制造商在pcb布线,电子元器件的适配,散热系统调校等综合能力。
gaming x trio是微星的魔龙系列,定位旗舰,所以当入门级的甜品卡遇到旗舰系列,将产生如何的火花,也是我们比较好奇和期待的。此次的魔龙系列与rtx 20系最大的区别我想是引入了石墨烯背板的散热设计,我们在后面的文章中也会详细说明。在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读:
石墨烯背板散热设计
旗舰高规,boost频率达到1830mhz
扎实用料,出色散热
相较公版更高的分数
再度进化的刀锋6代风扇设计
总的来说,微星geforce rtx 3060 ti gaming x trio有着超高规格的设计,也拥有更大的频率提升空间。而再度进化的第6代刀锋风扇,给显卡提供了更出色的散热性能和更安静的使用体验。魔龙还是那个魔龙,但性能早已不可同日而语,另外显卡导流罩部分的爪痕背光设计,更给魔龙增加了几分魔幻的感觉。
微星geforce rtx 3060 ti gaming x trio
在性能表现上,微星geforce rtx 3060 ti gaming x trio超高的频率以及出色的供电散热设计,让分数高于公版的同时温度更低。rtx 3060 ti这张甜品卡在2k分辨率下可以做到更高帧率的运行,甚至在4k分辨率下的部分游戏也有不错的表现,打破了人们对甜品卡性能不足的印象,加之超高的性价比,微星这款微星geforce rtx 3060 ti gaming x trio完全可以满足绝大部分游戏玩家的需求。
01 微星geforce rtx 3060 ti gaming x trio外观
首先还是先来看外观,我们本次评测的微星geforce rtx 3060 ti gaming x trio保持了魔龙系列一贯的风格,简单硬朗的几何线条贯穿卡身。
微星geforce rtx 3060 ti gaming x trio
微星geforce rtx 3060 ti gaming x trio显卡的整体尺寸为323×140×56mm,相对其他30系显卡来说卡身略宽,但是厚度适中。显卡正面采用三个10叶刀锋6代风扇主动散热,扇叶采用独特的环形设计,作为第2代tri frozr 散热系统的一个重要组成部分,能够进一步降低噪音,提高风压。
微星geforce rtx 3060 ti gaming x trio背板展示
微星geforce rtx 3060 ti gaming x trio的背板尾部采用镂空设计,可以让热风迅速穿透散热鳍片以及背板,令显卡温度进一步下降,另外在背板靠近芯片部位也有镂空设计,以便发热严重的元件能快速散热。
微星geforce rtx 3060 ti gaming x trio背板展示
另外在rtx 30系显卡中,微星的魔龙系列采用了石墨烯背板设计,石墨烯具有非常好的热传导性能。纯的无缺陷的单层石墨烯的导热系数高达5300 w/mk,是为止导热系数最高的碳材料。不过在显卡背板上肯定不会使用单层石墨烯,作为载体的石墨烯复合材料导热系数也是很不错的。
微星geforce rtx 3060 ti gaming x trio显卡支架
由于rtx 30系显卡本身的尺寸及重量较大,单纯靠机箱挡板和pcie插槽已经不足以支撑其重量了,所以在微星geforce rtx 3060 ti gaming x trio的包装内部还附赠了显卡支架提供额外的加固效果。
微星geforce rtx 3060 ti gaming x trio视频接口
视频输出接口上,微星geforce rtx 3060 ti gaming x trio采用dp 1.4a*3+hdmi 2.1的4接口设计,另外新的hdmi 2.1接口可支持单线8k的视频输出。另外从图中我们也能看到由于显卡宽度较大,金属挡板与显卡边缘相差大约2cm,在上机后挡板的螺丝不太好拧。
微星geforce rtx 3060 ti gaming x trio侧面
在供电接口上,微星geforce rtx 3060 ti gaming x trio采用了8+8pin供电,而且由于rtx 3060 ti的自身功耗较小,实测满载功耗为220w左右,建议电源为650w及以上,大部分用户都可以直接升级。
02 nvidia ampere架构下的rtx 3060 ti
微星geforce rtx 3060 ti gaming x trio采用了nvidia ampere架构,我们首先来看一下rtx 3060 ti的提升。
rtx 3060 ti采用ga104核心拥有174亿个晶体管,392平方毫米的面积,基于三星的8nm nvidia定制工艺,另外在rtx 3060 ti中我们都知道仍然采用了gddr6显存,不过不同于rtx 3080的micron,rtx 3060 ti采用了三星的gddr6显存。
我们在发布会中经常听到性能翻倍的说法,其实是因为本次nvidia ampere的sm在turing基础上增加了一倍的fp32运算单元,这就使得每个sm的fp32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的cuda数量,并不是把sm中的所有单元加起来计数,而是只统计fp32单元的数量,所以这样一来,sm中的【fp32 : int32】 从 1:1 变为 2:1。
rtx 3060 ti共有4864个cuda,其实它有2432个int32单元,但由于内部的fp32数量翻了一倍,所以最终实现了4864这个惊人的数字。
而这样粗暴的提升cuda数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用fp32算数指令,而fp32的加速也有助于光线追踪降噪着色器。
光追工作原理示意
在此次的nvidia ampere架构中,nvidia官方宣布为第二代rt core,它和第一代有什么不同呢。首先要知道rt core的工作原理是,着色器发出光线追踪的请求,交给rt core来处理,它将进行两种测试,分别为边界交叉测试(box intersection testing)和三角形交叉测试(triangle intersection testing)。基于bvh算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。
而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(bvh/三角形求交)进行加速。
rt core的变化
在turing的rt core中,可以每个周期完成5次bvh遍历、4次bvh求交以及一次三角形求交,在第二代rt core 里,nvidia增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。
运动模糊渲染原理
第二代rt core可以让光线追踪与着色同时进行,进行的光线追踪越多,加速就越快,它将光线相交的处理性能提升了一倍,在渲染有动态模糊的影像时,按照nvidia自己的实测,比turing快8倍。
稀疏深度学习
tensor core可以看作是geforce rtx gpu上的ai大脑。可加速用于深度神经网络处理功能的线性代数,这是现代ai的基础。例如用于ai超分辨率的nvidia dlss和用于ai增强的声画处理技术nvidia broadcast应用。
在本次的nvidia ampere架构的tensor core也得到了极大地加强,在第三代tensor core中,nvidia引入了稀疏化加速,可自动识别并消除不太重要的dnn(深度神经网络)权重,同时依然能保持不错的精度。
首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高tensor core的性能。
与此次rtx 30系显卡一同发布的还有一项新技术——rtx io。目前很多游戏动辄几十g甚至百g的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由cpu从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着nvme ssd的推出,读取速度相较机械硬盘能够快20倍,但受制于传统i/o限制,nvme高达7gb/秒的高速读写对于cpu是极大的负担。
传统的数据交换
在这个过程中,会占用多个cpu核心,压力急剧增大,占用较多的内存,而此时其实gpu是处于闲置状态的。rtx io的作用就是越过cpu解压再传输数据这一步,直接从pcie总线读取硬盘上经过压缩的数据,并且完成无损gpu解压,降低cpu占用,变向提升了性能。
rtx io可以极大解放cpu负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的directstorage来实现,对于目前容量的游戏来说,rtx io的改善效果有限,但假以时日等游戏容量上百g成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的hdmi 2.1接口,可以支持单线8k的视频输出,而上一代hdmi 2.0仅支持4k 98hz的视频输出,如果想要连接8k电视,则需要更多的线缆支持。
03 3dmark 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥微星geforce rtx 3060 ti gaming x trio显卡的最佳性能,主板和cpu采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3dmark,游戏性能测试使用游戏自带benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
gpu-z参数
首先看一下gpu-z的参数,rtx 3060 ti采用ga104核心,三星8nm工艺,芯片面积392平方毫米,拥有4864个cuda,微星geforce rtx 3060 ti gaming x trio的boost频率达到了1830mhz,而公版为1665mhz。采用8gb gddr6显存,位宽为256bit,显存带宽达到了448gb/s,光栅单元和纹理单元为80和152。
下面先进行的是用来衡量显卡dx11理论性能的3dmark fs套装:fs,fse,fsu三者分别对应显卡在1080p、2k、4k的理论性能,取显卡分数实际测试结果如下:
3d mark fs套装测试
在针对显卡dx11性能的3dmark fs套装测试中,得益于超高的频率,微星geforce rtx 3060 ti gaming x trio较公版rtx 3060 ti的成绩均有小幅领先,而相比rtx 2080 super,综合领先在3-6%之间。
3d mark ts套装测试
而在针对dx12环境下的time spy和time spy extreme测试中,微星geforce rtx 3060 ti gaming x trio领先rtx 2080 super更多,在ts成绩中领先5%,在tse成绩中领先12%。
推荐阅读
-
索泰RTX 3060 Ti X-GAMING OC怎么样 索泰RTX 3060 Ti X-GAMING OC评测
-
微星RTX 2060 Super GAMING X怎么样 微星RTX 2060S魔龙评测
-
微星RTX 3060 Ti GAMING X TRIO怎么样 微星RTX 3060 Ti GAMING X TRIO评测
-
微星魔龙RTX 3060 Ti显卡怎么样 微星魔龙RTX 3060 Ti显卡详细评测
-
索泰RTX3070Ti X-GAMING OC怎么样 索泰RTX3070Ti X-GAMING OC显卡评测
-
索泰RTX 3060 Ti X-GAMING OC怎么样 索泰RTX 3060 Ti X-GAMING OC评测
-
微星GTX1080Ti魔龙TRIO性能如何?微星GTX 1080 Ti GAMING X TRIO显卡图解评测
-
微星RTX 2060 Super GAMING X怎么样 微星RTX 2060S魔龙评测
-
微星魔龙RTX 3060 Ti显卡怎么样 微星魔龙RTX 3060 Ti显卡详细评测
-
微星RTX 3060 Ti GAMING X TRIO怎么样 微星RTX 3060 Ti GAMING X TRIO评测