欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

GPU延迟对比:AMD RDNA2完胜NVIDIA安培

程序员文章站 2023-03-23 21:43:20
cpu缓存与内存延迟测试,相信大家都有所耳闻,但是gpu同样的测试却几乎没人做过。chips and cheese就做了一次特别的测试,对比考察了amd、nvidia gpu架构的缓存、显存迟问题。首...

cpu缓存与内存延迟测试,相信大家都有所耳闻,但是gpu同样的测试却几乎没人做过。

chips and cheese就做了一次特别的测试,对比考察了amd、nvidia gpu架构的缓存、显存迟问题。

GPU延迟对比:AMD RDNA2完胜NVIDIA安培

首先是amd rdna2、nvidia ampere两家最新架构的比拼,代表是rx 6900 xt、rtx 3090,前者在几乎所有阶段都完胜。

rnda2架构创新性地加入了infinity cache无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约20ns的延迟,明显低于ampere。

更惊人的是,rdna2显存延迟和ampere几乎一模一样,但是别忘了,ampere只有两个层级的缓存,rdna2却有四个。

ampere的缓存架构更加传统,sm阵列私有一级缓存到二级缓存要增加超过100ns的延迟,rdna2从零级缓存到二级缓存则只增加了约66ns。看起来,ga102核心面积过大,也直接增加了延迟。

这正好可以解释amd rdna2架构在低分辨率下性能、能效更优秀,因为二级缓存、三级缓存延迟很低,更适合执行较小的负载。ampere则相反,高负载下优势明显,比如说4k分辨率。

GPU延迟对比:AMD RDNA2完胜NVIDIA安培

说完了gpu之间的对比,那么gpu、cpu放在一起怎么样呢?这里以rx 6900 xt、intel四代酷睿i7-4770为例来看看。

cpu的缓存自然不是一个级别的,所以这里y轴用了线性数据,可以看到全程大大低于rdna2,搭配ddr3-1600 cl9内存延迟只有63ns,rx 6900 xt、gddr6的组合则有226ns,另外末级缓存平均延迟分别是53.42ns、123.2ns。

GPU延迟对比:AMD RDNA2完胜NVIDIA安培

再看看前几代的nvidia gpu,包括maxwell架构的gtx 980 ti、pascal架构的gtx 1080、turing架构的rtx 2060 mobile。

maxwell、pascal其实差不多,前者整体略高一些,可能是受制于芯片面积较大、核心频率较低。

turing则已经有了ampere的样子,一级缓存延迟低得多,二级差不多,奇怪的是显存延迟在32mb之后偏高,原因未知。

GPU延迟对比:AMD RDNA2完胜NVIDIA安培

amd考察了terascale架构的hd 5850/6950、gcn架构的hd 7970,再加上rx 6900 xt,很明显在逐代降低,而且是各级缓存都在同时进步。

GPU延迟对比:AMD RDNA2完胜NVIDIA安培

- the end -

转载请注明出处:快科技