性能媲美GTX 1080 Ti!NVIDA GeForce RTX 3060首发评测:2499元真甜点卡
一、前言:老黄专为游戏玩家打造的gpu
对于这个阶段的游戏玩家而言,要以官方建议零售价买到一款游戏显卡似乎已经是不可能实现的事情!矿工的疯狂超乎所有人的想象,新一代显卡基本上已经被他们所垄断,高售价+缺货断绝了很多玩家升级电脑甚至是玩游戏的念想。
也许是老黄看透了玩家的痛苦!为了准备足够多的库存,原定于2月初发布的nvidia geforce rtx 3060被推迟到了25号。更重要的一点,这款直接在硬件层面屏蔽了一半的挖矿能力(基本上无法破解),是真正为游戏玩家准备的甜点显卡。
虽然型号看起来很接近,但geforce rtx 3060并没有采用rtx 3060 ti的ga104核心,nvidia重新设计了ga106核心来打造这款显卡。
完整的ga106核心拥有3组gpc,30组sm单元,3840个流处理器,48个rop、30个光追单元和120个纹理单元,120个tensor core。
geforce rtx 3060稍微做了一些阉割,砍掉了2组sm单元,流处理器变成了3584个,纹理单元和tensor core也同步减少到了112个,但是对于游戏性能至关重要的很rop单元依然是48个。
下图是nvidia geforce rtx 3060的详细规格参数:
rtx 3060的显存容量达到了12gb,这多少有些令人匪夷所思!毕竟更高端的rtx 3060 ti/rtx 3070也才只有8gb,次旗舰级别的rtx 3080也就10gb显存。rtx 3060配备的12gb看似离谱,但是考虑到其售价仅为2499元,四舍五入,12gb显存等于白送。
另外实际上,目前对于cuda支持非常完善的应用,比如resolve,photoshop等软件,会调用非常多的显存,因此从某些方面来说,nvidia geforce rtx 3060反而更适合用于生产力创作。
关于安培gpu的构架此前我们已经有过详细的介绍,在这里我们化繁为简,将其做了简单的归纳如下:
1、8nm制程工艺:
图灵构架使用的三星12ffn工艺,在754mm2的面积内集成了186亿只晶体管。安培构架使用的是三星8n工艺,在628mm2的芯片内部集成了280亿只晶体管。算下来晶体管密度提升了83%之多。
2、整合int32与fp32单元:
图灵的int32单元只能做整数运算,闲置率很高。为了解决这个问题,提升int32单元的利用率,nvidia改进了int32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,相当于整合了int32和fp32单元,因而使得以fp32单元计数的gpu流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
3、将rop单元从内存控制器中分离:
传统的rop单元被集成在内存控制器中,阉割gpu位宽会降低rop单元数量。而安培构架将rop单元变成了gpc的一部分,每个gpc含有16个rop单元,只要gpc数量不被阉割,rop单元数量就不会减少。
比如rtx 3070与rtx 3080一样都有6组gpc,rop单元数量同样都是96个。
4、第二代rt core:
nvidia通过提升插值算法,提升了光线追踪技术在动态模糊效果下的精确度,使得安培构架的光追性能得到了翻倍提升。第一代rt core可以提供10giga rays/s的性能,第二代rt core可以达到20giga rays/s。
5、第三代tensor core:
第三代tensor core的效率是第二代的4倍,即便安培构架将每个sm中的tensor core减半,它依然能达到图灵2倍的效能。
6、rtx io技术:
这项技术可以让游戏在加载时完全规避cpu,直接将游戏数据包从ssd写入到gpu的显存中,由gpu替代cpu进行数据解包。gpu的整数/浮点性能数十倍于cpu,可以瞬间完成数据的解包工作。
不过这项技术需要微软directstorage api的支持,预计2022年会正式开始应用。
除了以上技术之外,安培构架还支持pcie 4.0、nvidia reflex等技术,就不再一一叙述了。
相关阅读:
amd甜点新卡正式发布:频率史无前例、竟可战3070!2.1万元的rtx 3090卡皇挑战1000w功耗!跑分大吃一惊nvidia点评ps5主机:不划算nvidia:安培显卡的成功与矿工无关