索泰RTX3080 12G PGF显卡评测 精妙的刀法
1月11日,nvidia悄悄发布了rtx 3080的12gb显存版本,这款大显存版本的rtx 3080在ces期间并没有作为重点报道。所以这款增加2gb显存的版本,在性能表现上究竟有何变化,下面是索泰geforce rtx3080 12g6x pgf oc显卡的评测。
其实早在rtx 30系显卡的发布之初,就有玩家质疑,作为本代的旗舰级产品,显存只有10gb,真的够用吗?不会爆显存吗?
要知道现在的3a大作,都是吃显存大户,显存对于显卡来说,虽然不是直接影响性能的关键,但它可以成为显卡的瓶颈所在。打个比方,如果一款游戏在爆显存的情况下,即便它的性能再高,游戏帧数依然会止步不前。
索泰geforce rtx3080 12g6x pgf oc
另外此次12gb版本的rtx 3080不仅在显存上有所增加,核心数量也有些许提升,所以相较早先发布的rtx 3080 10gb版本,区别大不大,下面我们就来实际测试一下。在评测开始前,笔者先还是先将这款显卡的特点列出方便大家阅读:
1.12gb大显存,与rtx 3080 ti相同
2.4k分辨率3a大作无压力
3.pgf旗舰系列,灯光效果惊艳
pgf作为索泰的旗舰系列,在外观、灯光和性能方面都无可挑剔,尤其是点亮那一刻的视觉观感,当然前提是竖装显卡。而在性能上,索泰geforce rtx3080 12g6x pgf oc相较公版“超频”后,又再度将性能提升,介于rtx 3080 10gb与rtx 3080 ti之间,有需求的用户可以关注一下市场行情。
01 nvidia ampere架构的ga102
索泰geforce rtx3080 12g6x pgf oc显卡采用了nvidia ampere架构,我们首先来看一下参数提升。
完整的ga102核心
完整的ga102 gpu包含7个gpc(图形处理集群)42个tpc(纹理处理集群)以及84个sm(流处理器)组成。gpc是占据主导地位的高级模块,拥有所有的关键图形处理单元,每个gpc包含一个专用光栅引擎。在新的nvidia ampere架构中,每个gpc还包含了两个rop分区,每个分区包含8个rop单元。
ga102核心拥有283亿(28300 million)个晶体管,628平方毫米的面积,基于三星的8nm nvidia定制工艺,来自三星的gddr6x显存。
geforce rtx 3080 10gb版 核心
上图为rtx 3080 10gb版核心,其中包含6个gpc(图形处理集群)、34个tpc(纹理处理集群)以及68个sm(流处理器)组成。
可以看出虽然此前版本的rtx 3080 10gb也采用了ga102核心,但内部还是经过阉割的。此次的rtx 3080 12gb在此基础上又增加了核心数量,所以单单理解为“12gb”版本并不准确,下面我们在测试中会详细说明。
02 索泰geforce rtx3080 12g6x pgf oc概览
首先来看这款显卡的外观,索泰geforce rtx3080 12g6x pgf oc显卡是大家熟悉的索泰旗舰“排骨饭”,在rtx 30系显卡中做了相当大的升级,我认为灯效甚至达到了“登峰造极”的程度。
索泰geforce rtx3080 12g6x pgf oc
索泰geforce rtx3080 12g6x pgf oc的整体尺寸为309×136×61mm,导流罩采用深灰色为底,金属质感较强的银色点缀,不过装饰并不是它们的重点。
索泰geforce rtx3080 12g6x pgf oc灯效
全新的pgf系列显卡,上机效果堪称惊艳,为这个效果也值得竖装显卡。开机默认rgb效果循环渐变,从正面看起来颇有一种未来科技的感觉。
索泰geforce rtx3080 12g6x pgf oc
散热部分,索泰geforce rtx3080 12g6x pgf oc采用pgf专属的“守望者散热系统”,8热管三风扇及“冰镜”导热模组散热设计,可以让旗舰显卡也稳定控温。另外显卡还采用了16+3相供电,第ii代白金用料搭载sep供电系统,让显卡工作更稳定。
索泰geforce rtx3080 12g6x pgf oc背板
索泰geforce rtx3080 12g6x pgf oc的背板采用铝合金打造,整体为磨砂质感,并有多重反锁结构,保护pcb不受外力而变形。
镂空部位还可以辅助发热量大的元器件散热,考虑到正常侧装显卡的用户,pgf系列的显卡尾部还有该系列独有的信仰logo灯。
8+8+8pin供电接口
作为本代的旗舰级产品,索泰geforce rtx3080 12g6x pgf oc显卡的默认功耗约为350w,需8+8+8pin的外接供电,推荐电源为750w及以上。
dp1.4a*3+hdmi 2.1*1的四接口
视频输出接口采用dp1.4a*3+hdmi 2.1*1的四接口设计,新的hdmi 2.1协议最高已可支持单线8k的视频输出,所以对于超高分辨率提供了更好的扩展性。
03 3dmark理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥索泰geforce rtx3080 12g6x pgf oc显卡的最佳性能,主板和cpu采用了11代桌面旗舰级配置,具体如下:
在测试成绩上,基准测试采用3dmark,游戏性能测试使用游戏自带benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
gpu-z参数
首先看一下gpu-z的参数,目前这款软件还没有完全识别12gb版本的rtx 3080,不过一些主要的参数已经可以看到。
索泰geforce rtx3080 12g6x pgf oc采用ga102核心,拥有8960个cuda,相比10gb版rtx 3080的8704 cuda多了256个,相当于多了2个sm单元。
该卡的频率为1260-1755mhz,采用micron的12gb gddr6x显存,位宽为384bit,显存带宽达到了912.4 gb/s,相比rtx 3080 10gb大了将近152 gb/s。光栅单元和纹理单元分别为96和280。
下面先进行的是用来衡量显卡dx11理论性能的3dmark fs套装:fs,fse,fsu三者分别对应显卡在1080p、2k、4k的理论性能,取显卡分数实际测试结果如下:
3d mark fs套装测试
在针对显卡dx11性能的3dmark fs套装测试中,索泰geforce rtx3080 12g6x pgf oc可以看到比rtx 3080 10gb版本肉眼可见的性能提升。当然,这一方面要归功于核心数量和显存方面的提升;另一方面,则因为我们测试的为索泰旗舰系列。
索泰geforce rtx3080 12g6x pgf oc相比公版rtx 3080 10gb显卡来说,在dx11的综合成绩上提升8%左右,而相比rtx 3080 ti的成绩,差距约为4%。
3d mark ts套装测试
而在针对dx12环境下的time spy和time spy extreme测试中,索泰geforce rtx3080 12g6x pgf oc相比rtx 3080 10gb版提升约为4%,与rtx 3080 ti的成绩差距约为3.5%。
3d mark 光追测试
portroyal是3dmark中专门针对光追性能的测试项,索泰geforce rtx3080 12g6x pgf oc相比rtx 3080 10gb版提升约为6%,与rtx 3080 ti的成绩差距约为5%。
综合3dmark的所有测试成绩来看,rtx 3080 12gb版不光是在显存上增加了2gb,而是将整体的性能提升到了rtx 3080 10gb和rtx 3080 ti之间。刨去索泰旗舰系列的因素,如果只按标准频率来看,rtx 3080 12gb相比rtx 3080 10gb的提升大约在3-4%。
04 游戏性能测试
在游戏性能测试中,我们选择了《刺客信条:英灵殿》、《无主之地3》、《地平线5》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
首先是《刺客信条:英灵殿》,在实测表现中,rtx 3080 10gb的分数差距比较明显,另外三款显卡差距微乎其微,但是在4k分辨率下,rtx 3090依然强势。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,正式版已经在steam发售只要48元,属于小品级游戏中的大制作。
另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“rtx 最高/dlss 质量”模式下进行。这个演示demo涵盖了大量光追元素,大部分显卡的跑分成绩都偏低,4k分辨率下4款显卡的差距不超过3帧。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“rtx最高/dlss质量”下进行。
《地平线5》游戏测试
本次测试我们新加入了《地平线5》,作为本代旗舰产品,我们测试了索泰geforce rtx3080 12g6x pgf oc在4k分辨率下,不同画面预设的帧数表现。可以看到在极端和低画质下,帧数差距将近两倍。
05 功耗及温度测试
功耗测试中,我们选择furmark软件进行拷机测试,并采用gpu-z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
索泰geforce rtx3080 12g6x pgf oc经过我们的实测在满载状态下单卡功耗为350-360w左右,与rtx 3080 10gb版几乎没什么差距,建议搭配750w及以上电源。
温度测试
温度方面,本次的索泰geforce rtx3080 12g6x pgf oc经过15分钟左右的拷机,温度稳定为68℃左右,显存温度为80℃。
06 精妙绝伦的刀法!
本以为只是一次简单的显存提升版本,没想到nvidia还是给了我们不少惊喜。核心数量和显存的增加,最终都体现在性能上。
从产品定位上来看,rtx 3080 12gb版更像是rtx 3080 10gb的超频版,只不过这次是官方超频,整体性能提升约为3-4%。
索泰geforce rtx3080 12g6x pgf oc
价格方面,目前rtx 3080 10gb版市价最便宜的卖到了8499元左右,rtx 3080 12gb版市场价贵1000-1500元左右。从性价比方面来看,显然还是rtx 3080 10gb更有优势,但目前rtx 3080 12gb的定价也“合乎情理”。
不过索泰geforce rtx3080 12g6x pgf oc显卡在nvidia的官方“超频”基础上,再次提升,让12gb版本的性能完美介于rtx 3080和rtx 3080 ti之间。除了性能上的提升,pgf系列的灯光效果也堪称惊艳,对得起旗舰之名。
索泰geforce rtx3080 12g6x pgf oc
总之此次的rtx 3080 12gb版本,并不是简单地显存升级,而是带来了货真价实的性能升级。用户在购买时也不用考虑买新还是买旧的问题,早先发布的rtx 3080 10gb依然能打,只要按需购买即可。
07 附录1-光追及dlss效果
上面我们测试了部分游戏的光追和dlss性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《光明记忆:无限》rtx on(点击查看大图)
《光明记忆:无限》rtx off(点击查看大图)
《光明记忆:无限》温泉场景中的光追效果是最为耗费显卡性能的。不难发现,最大的变化来自水中的倒影,而这一组倒影的计算难度非常高,由于并不是平静水面,所以要首先要考虑光线在水面的变化,其次与岸边鹅卵石的光线折射效果,最后则是综合前两种效果,将光线照射在水池底部。
《赛博朋克2077》rtx on(点击查看大图)
《赛博朋克2077》rtx off(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
rtx on(点击图片查看大图)
rtx off(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》rtx on(点击查看大图)
《堡垒之夜》rtx off(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》rtx on(点击查看大图)
《魔兽世界9.0》rtx off(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》rtx on(点击查看大图)
《控制》rtx off(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
dlss的对比测试中,首先还是《光明记忆:无限》在这一组对比中,在画面差距上,从dlss关到dlss性能依旧看不出什么变化,但是在超级性能模式中,墙壁的清晰度以及轮廓都有所下降。
当然总的来说,尽管dlss贡献了非常大的功劳,但可以看得出《光明记忆:无限》在优化方面下了很大功夫,这对于靠一人主导的游戏来说难能可贵。
《赛博朋克2077》dlss模式对比
《赛博朋克2077》这款游戏中,以2k/rtx on/dlss关闭 原生画质下作为标准,在打开dlss质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在dlss平衡和dlss性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》dlss模式对比
画质说明
在《逆水寒》的dlss测试中,我们将画面设置为4k分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭dlss中,游戏帧数为26帧原生画质,打开dlss快速模式后为41帧,而打开dlss超级性能模式后为57帧。通过放大图片不难发现原生画质和dlss快速模式的区别很小,而dlss超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
《永劫无间》dlss模式对比
在《永劫无间》的dlss对比中,原生画质大家可以注意角色发带的编制质感,每一根发丝边缘都较为清晰,同时肩部的服装花纹也有较为明显的凹凸感。在dlss打开后,由于其工作原理就是缩放后,再由ai算法放大进行边缘重建,所以在质量模式中,发丝就会丢失部分细节,但如果不细看很难发现,同时发带的细节也保留的相当完好。
而在dlss性能模式中,头发的质感则更差一些,并且发带的编织感有明显下降,另外腰间的配置边缘也会变模糊。最后在dlss超级性能模式中,角色整体则会较糊,无论是头发还是服饰,所以如果不是非常追求高帧数的玩家,不建议开启dlss超级性能模式。
08 附录2-ampere新特性
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
nvidia reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
nvidia reflex
在20系显卡中nvidia反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了nvidia将推出自己的电竞显示器nvidia 360hz g-sync esports,还有nvidia reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的led鼠标电路。而使用带有nvidia reflex技术的显示器将内置精确的延迟分析工具,可在cpu和gpu中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
nvidia broadcast
nvidia broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张geforce rtx系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。nvidia broadcast的工作原理是利用ai算法通过dgx超级计算机深度学习而来。
nvenc编码
同时rtx 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开obs推流后cpu占用会直接飙升到50%左右,而基于gpu的nvenc解码可以极大地减轻cpu负担。
nvidia studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但nvidia专为内容创作者推出的nvidia studio驱动则是承担着连接创作软件和显卡功能的关键。
nvidia studio
nvidia studio驱动经过更新与优化,对于最新版本的adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用nvidia cuda技术,gpu加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在ai计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以gpu渲染为14.98秒 而cpu渲染为11分钟
当然nvidia studio的加速创作绝不止adobe一家,davinci、keyshot、blender、d5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以gpu加速,有效提升创作效率。
总结:本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注的更多内容!