欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

程序员文章站 2022-04-05 18:15:34
狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测今年7月AMD发布了久违的旗舰级显卡—RADEON RX VEGA 64/56,全新的高性能计算架构,不但要做好高端游戏,还要满足图形工作站、高性能计算、机器学习等各方面的需求,下面就详情来看看... 17-08-15...

amd正式发布了这款采用革命性hbm显存的全球首款公版水冷显卡,这款卡实在是太过惊艳,惊艳了业界也惊艳了我。过了一年,amd发布了采用14nm的polaris显卡,在业界掀起了红色革命,amd的独显市场份额也从2成上升到了3成。又过了一年,amd终于在今年7月发布了久违的旗舰级显卡——radeon rx vega 64/56,众多a饭翘首期盼的amd卡皇终于降世了!

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

此时此刻,距离amd上一代基于fiji(斐济)核心的旗舰显卡radeon r9 fury x诞生已经过去了两年零一个多月的时间,这在以往是非常不可思议的。

尤其是过去一年多来,nvidia pascal家族逐次推进,从高到低完整覆盖,amd方面虽然也有全新的polaris(北极星)核心,但毕竟是个小核心,在中低端市场上表现稳健,却没有一位老大哥带头,总是缺乏底气。

vega核心最早的说法是2016年10月份就会登场,但在众多玩家尤其是a饭们的焦急等待中,又是十个月过去了,vega才终于瓜熟蒂落,而此时距离其主要竞争对手gtx 1080/1070的诞生,也已经有一年零三个月之久了。

对于vega为何迟到这么久,amd高级副总裁兼radeon技术事业部首席架构师raja koduri对我们解释说:

一是14nm工艺,这是amd第一次同时在cpu和gpu上使用同一种工艺。

二是vega架构是全新设计的,从底层开始都焕然一新,而如今设计一种全新的高性能计算架构,不但要做好高端游戏,还要满足图形工作站、高性能计算、机器学习等各方面的需求。

当然,amd作为唯一一家同时拥有高性能cpu、gpu计算平台的企业,本身并不是多么财大气粗,同时面临intel、nvidia两大可以分别专注一个领域的强敌,可以说相当不易,走过的每一步都值得尊重。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

回来再说vega,作为一个全新设计的高性能核心,它肩上的担子是相当重的,玩游戏也只是一个方面,它要做的事儿多着呢。

事实上在此之前,vega家族已经逐渐开始生根发芽,甚至可以说逐渐枝繁叶茂了。

在服务器和高性能计算领域,我们见到了radeon instinct mi25,直面nvidia tesla系列,完美搭档自家epyc服务器处理器;

在图形工作站领域,我们有了radeon pro wx 9100、radeon pro ssg,不但竞争nvidia quadro系列,后者还首创了显卡集成ssd,容量高达2tb,后续据称还有radeon pro 64/56;

在游戏开发领域,radeon vega frontier edition风冷版、水冷版大家也都不陌生了,这也是amd对于nvidia titan x/xp的一个回应;

在游戏领域,amd也是卯足了劲,首发就有三款产品(也可以说四款),而且后续还有更多惊喜!

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

【vega架构解析:amd gpu五年来最革命性进步】

不知不觉,radeon这个显卡品牌已经诞生17年了,也伴随太多diyer走过了青春岁月,而时代在变化,radeon面临的需求也越发多样化。

amd在技术白皮书中特别指出,除了传统游戏不断冲击视觉技术极限,gpu还面临着更广泛需求的挑战,从机器学习到专业视觉化,从虚拟化到虚拟现实,gpu的计算能力也在快速跟上,以满足超大数据集的需求,但是gpu存储能力并未得到显著提升。

为此,amd全新设计了vega架构,这也是gcn图形架构诞生五年以来,amd gpu最革命性的变化。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

不过,新核心的变化实在太多了,涉及几乎所有方面,而且很多都过于专业,所以这里我们之挑选其中几个要点和大家分享。

1、vega 10:高集成度的大核心

vega架构的第一个产品是“vega 10”,一个相对大规模的芯片,面向高分辨率游戏、vr虚拟现实、高性能计算和机器学习、高负载工作站等领域。

它采用14nm lpp finfet工艺制造,集成了125亿个晶体管,核心面积486平方毫米。

相比之下,28nm工艺的上代大核心fiji集成了89亿个晶体管,面积却有596平方毫米,也就是说vega 10核心晶体管规模多了整整40%,面积却缩小了18%!

另外,同样14nm工艺的polaris 10核心集成57亿个晶体管,核心面积232平方毫米,vega 10与之相比晶体管多了1.2倍,面积增大了1.1倍,集成度也有所提高。

vega 10核心经过优化后,可以充分利用finfet工艺的低漏电率优势,频率也高于以往任何radeon显卡,官方标称最高加速频率就有1.67ghz,而实际运行中完全可以超过1.7ghz,实测中甚至见到过1.75ghz。

相比之下,上代fiji核心最多只能加速到1ghz左右,polaris 10最高则是超过1.3ghz。

raja表示,14nm工艺对cpu和gpu来说都很平衡,在cpu上可以实现高频率,gpu上则可以实现高集成度,比如vega就因此比fiji核心要小得多,但是性能高出很多。

vega 10核心依然有64个计算单元、4096个流处理器,规模上和fiji是一样的,但凭借高进的架构和更高的频率,单精度浮点计算性能达到了惊人的13.7tflops(每秒13.7万亿次计算),而且还支持16位数学计算,半精度浮点性能达27.4tflops。

vega 10还是amd第一个使用了infinity fabric互连设计的gpu核心,也就是zen处理器里的那一套。这种低延迟的soc型互连总线可以在芯片的不同模块之间提供一致性通信,也使得芯片设计更加弹性灵活,可以做到模块化,能随时根据需要加入不同配置和模块。

vega 10芯片中,infinity fabric连接着图形核心与其他主要逻辑模块,包括显存控制器、pci-e控制器、显示引擎、视频加速器等等,也为未来的apu奠定了基础。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

2、全新显存架构和高带宽缓存控制器(hbcc)

gpu通常需要在本地显存中保存所需要数据集或者资源的全部,因为走pci-e等外部通道的话,将无法保证足够的带宽或延迟。

随着软件内存管理的日益复杂,这对开发者提出了越来越高的挑战,而显存成本又决定了不可能把容量做到特别大。

为此,vega架构可以将本地显存作为末级缓存使用。如果gpu要访问的部分数据不在显存之内,可以通过pci-e总线获取所需内存页面,并保存在高带宽缓存中,而不是让gpu停下来,等待完成全部所需资源的复制。

页面通常比整个纹理等资源小得多,复制可以迅速完成,后续访问就直接从缓存中拉取,延迟自然非常低。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

这主要得益于vega架构新增的高带宽缓存控制器(hbcc),可以将远程内存作为本地缓存使用,同时可以将本地显存作为末级缓存使用。

hbcc支持49位寻址,最多能访问512tb虚拟寻址空间,而现代cpu的寻址空间也不过48位,同时比最多10+gb的显存也多了几个数量级。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

hbcc被视为vega架构中最大的革新,简单地说可以把整个系统内存当做显存来使用,相当于一块显卡可以拥有tb级别的高速显存,无论性能还是容量都不是事儿。

换言之,它实现了某种程度上的一体化内存池,这部分amd称之为“hbcc内存区”(hms)。

radeon pro ssg之所以能板载2tb ssd,就是得益于这种设计,消除了从gpu到ssd之间的隔阂,可以直接访问其中的数据,从而大大降低延迟和过载。

为了将这种设计发挥到极致,vega架构其他部分也做了针对性调整,比如说二级缓存就扮演着中心角色,容量翻番到4mb,所有图形区块都直接与其相连,而以往像素引擎是有自己的缓存的。

当然,hbcc设计也需要开发者去学习适应,才能挖掘和释放其最大潜力,而且它也不是必须使用的,开发者如果对显存容量和性能没有特别高的要求,仍然可以走传统路线。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

显存方面,vega搭配了第二代高带宽显存hbm2,类似fiji那样与gpu核心整合封装,使用硅中介层与gpu物理互连。

得益于新的技术和工艺,hbm2最多可以堆叠8个,单颗容量最大8gb,vega专业卡就用了两颗供16gb,rx vega家族则配备了两颗供8gb。

同时,hbm2每个堆栈的位宽达1024-bit,因此只需很低的频率,就能提供极高的带宽。

在显卡驱动控制面板中,用户可以根据自己的需要,手动调整hms的容量范围。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

3、下一代计算单元(ncu)

amd gcn架构的核心模块是计算单元(cu),vega也是如此,但同样做了全面翻新,官方称之为下一代计算单元(ncu)。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

ncu的一个亮点变化就是加入了快速堆叠运算(rapid packed math/rpm),允许两个fp16半精度的运算同时执行,并支持丰富的16位浮点和整数指令集,包括fma、mul、add、min/max/med、bit shift等等。

一般来说,日常游戏、3d渲染对单精度fp32、双精度fp64要求比较高,而在大规模深度计算中,fp16半精度十分关键。

vega首次支持半精度计算,每个ncu拥有64个alu,可以灵活地执行紧缩数学操作指令,比如每个周期可执行512个8位数学计算,或者256个16位计算,或者128个32位计算。这不仅充分利用了硬件资源,也能大幅度提升vega在深度学习上的性能。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

rpm专门用于加速fp16半精度的运算速度,比如新的着色器可以利用rpm,在amd一直引以为傲的tressfx毛发渲染中,将每秒能渲染的头发数量增加一倍,因此,rpm可以帮助gpu核心进行更快更强的的物理计算。

ncu还可以同时进行计算和图形处理,并且能够根据负载不同而变换simd单元宽度,结果就是以往需要多个计算单元才能完成的任务,现在只需一个就能搞定,不会造成浪费。

种种改进结合,vega 10核心可以每秒钟执行27万亿次浮点计算,或者55万亿次整数操作。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

4、下一代几何引擎

vega的整个几何引擎针对更高三角形吞吐量做了优化,增加了新的快速硬件路径,比以往更有弹性、可编程性。

vega几何引擎里的创新很多,最具代表性的当属新的原语着色器(primitive shader),可以合并部分几何处理流水线,抛弃隐藏的、没必要的原语,代之以新的高效着色类型,而且启动非常快,每时钟周期的峰值原语剔除率是以前的四倍。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

vega 10拥有四个几何引擎,加入了新的原语着色器之后,每时钟周期的最大原语吞吐量可以超过17个,而以前只能做到4个。

同时,vega架构还加入了新的智能负载分配器(iwd),可以根据实际情况持续调整流水线设定,更好地平衡各个几何引擎之间的负载,提高利用率。

狙杀GTX 1070/1080!AMD Radeon RX Vega 64/56限量和水冷版显卡深度图解评测

5、下一代像素引擎

随着4k/5k/8k超高分辨率和240hz高刷新率显示器的出现和普及,以及vr虚拟现实的进一步发展,显卡像素吞吐能力也面临着越来越大的压力,vega为此重新设计了像素引擎,加入了大量新功能。