次世代大作标配 光线追踪DLSS深度剖析
随着rtx 30系显卡的发布,人们在关心性能的同时,一些软性技术的应用和更新更受到玩家的青睐,如游戏中的光追表现和dlss效果。
这两种技术可以说有着划时代意义,光线追踪可以让我们在游戏中获得更为真实的光线效果,让游戏画面不断趋近于真实。
同时还可以节省大量游戏开发者的时间,而dlss效果则可以在不降低画质的情况下让帧数暴涨。
在新的geforce rtx 30系显卡中,nvidia更新了rt core和tensor core,并且新增了大量支持这两项技术的游戏,今天笔者简单为大家简单说明并进行几款游戏的实测展示。
首先介绍一下测试平台,为了能完全发挥技嘉aorus rtx 3080 xtreme 10g显卡的性能,我们选择了目前桌面旗舰级cpu和主板i9-10900k和z490主板。
rt core及光线追踪详解
其实,光线追踪的概念在很早就已经被人所提出了。光线追踪技术其实就是将光源产生的光线所产生的折射,反射等光线变化和对阴影产生的反应通过计算准确的反映到画面之中,为人们带来百分之百的光影效果。
在此次的nvidia ampere架构中,nvidia官方宣布为第二代rt core,它和第一代有什么不同呢。
首先要知道rt core的工作原理是,着色器发出光线追踪的请求,交给rt core来处理,它将进行两种测试,分别为边界交叉测试(box intersection testing)和三角形交叉测试(triangle intersection testing)。
基于bvh算法来判断,如果是方形,那么就返回缩小范围继续测试,如果是三角形,则反馈结果进行渲染。
相较于初代的turing rtx架构,nvidia ampere架构在算力上有着成倍的增长,同时新的架构翻倍了光线与三角形的相交吞吐量,rt core达到58 rt tflops,而turing为34 rt tflops。
而光线追踪最耗时的正是求交计算,因此,要提升光线追踪性能,主要是对两种求交(bvh/三角形求交)进行加速。
在turing的rt core中,可以每个周期完成5次bvh遍历、4次bvh求交以及一次三角形求交,在第二代rt core 里,nvidia增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能。
《轩辕剑7》光线追踪演示
关于概念性的东西我们就说这么多,相信玩家更想看到的还是光追的实际效果,首先我们来测试一下近期上线的国产游戏《轩辕剑7》。
在《轩辕剑7》中,我们以序章的街道场景来做对比,第一张图为打开光追后的效果,光线追踪的效果显而易见。
打开光追后街道的灯光、阴影以及太阳光在水面的反射都有很大改善,而游戏整体的色调也由冷变暖,更富有生活气息。
第二组对比我们选择了太史府门前,通过对比不难发现,打开光追后的效果影响了游戏整体的气氛,第一张的灯光氛围营造出了回家温馨的感觉,而第二张画面阴暗感觉马上会有什么不好的事发生,虽然比较符合游戏背景,但整体观感略差。
tensor core及dlss详解
我们都知道光线追踪在游戏内会耗费巨大的计算资源,这也导致了它在20系显卡中由于算力的因素,玩家反响并不大。而在全新的nvidia ampere架构中不但引入了第二代rt core,还有第三代tensor core。
nvidia自volta架构开始,在gpu中增加了针对深度学习加速设计的矩阵运算单元,并称之为tensor core(张量计算核心)。
在图灵架构里,nvidia引入了第二代tensor core,而到了rtx 30系列所采用的ampere架构,则进化到了第三代tensor core。
在第三代tensor core中,nvidia引入了稀疏化加速,可自动识别并消除不太重要的dnn(深度神经网络)权重,同时依然能保持不错的精度。
首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高tensor core的性能。
在实际应用中,深度学习技术在图形图像各个领域都有着价值巨大的应用,而在游戏体验中则是被称为深度学习超采样的dlss技术。最新一代的dlss能够使得游戏画质极大提升,细节和锐度媲美、甚至超越原生分辨率。
dlss本质是一种图像重建算法,其加原理其实也很简单。开启dlss后,游戏引擎中的诸如动态光源、阴影的计算,封闭空间环境遮挡(ssao)、屏幕空间反射(ssr),甚至实时光线追踪。
都会被降低到1/2甚至1/4像素的低分辨率下运行,gpu的负担大幅度减轻。渲染得出的最终场景会通过tensor core结合dlss进行高分辨率重建,从而用较低的gpu负载获得流畅且画质极佳的游戏体验效果。
《堡垒之夜》、《死亡搁浅》dlss效果展示
下面我们来通过实测看一下不同游戏中开启dlss后的效果,我们选择了《堡垒之夜》和《死亡搁浅》进行测试。
首先来看《堡垒之夜》的对比画面,其实在游戏中dlss的开关几乎不会影像画面,但是带来帧数的变化却非常明显。
第一组对比由于天色的变化略失精准,但打开dlss质量模式后,角色衣服的褶皱及棱角更明显。在帧数上dlss关为78帧,dlss质量为115帧,帧数提升47%。
第二组对比为dlss性能与dlss极致性能,两者从画面上几乎看不出区别,但是帧数仍然提升非常恐怖。
相较于关闭dlss的帧数,dlss性能为129帧,提升65%;dlss极致性能为145帧,提升85%。
145帧的成绩已经完全达到高刷新电竞显示器的帧率要求,同时在游戏中也能更顺畅,最主要的是画质没有任何降低。
下面我们来看小岛先生的最新游戏《死亡搁浅》,这款游戏有个特别的设计就是自带锐化,从图中我们也能看到,在一些细小部位,锐化的痕迹十分明显。
在关闭dlss的情况帧数为118,而打开dlss质量模式后帧数为145,画面经过ai处理,消除了很多锯齿。帧数方面,打开dlss质量模式后,提升为22%。
在选择dlss性能和dlss极致性能后,帧数为150帧和163帧。同样画面相较原生画质来说将锐化效果进一步消除,观感更柔和。与原生画面的帧数相比,提升分别为27%和38%。
其实和光追相比,我认为dlss对于玩家来说更是终极梦想,在画质不变甚至更好的情况下极大提升游戏帧数,这意味着你可以花费更少的价格体验到更高端显卡的性能,同时如果你的显卡性能够强劲帧数比较富裕,还可以再开启光追效果,进一步增加沉浸感。
- the end -
原文链接: 责任编辑:振亭
下一篇: 正则中需要转义的特殊字符小结