欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

程序员文章站 2022-03-15 17:01:43
昨日晚间,amd正式发布了新一代instinct mi100计算卡,首次采用针对hpc高性能计算、ai人工智能全新设计的cdna架构,和游戏向的rdna架构截然不同。instinct mi100计算卡...

昨日晚间,amd正式发布了新一代instinct mi100计算卡,首次采用针对hpc高性能计算、ai人工智能全新设计的cdna架构,和游戏向的rdna架构截然不同。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

instinct mi100计算卡采用台积电7nm工艺制造,集成120个计算单元、7680个流处理器,核心频率最高1502mhz,并专门加入了matrix core(矩阵核心),用于加速hpc、ai运算。

它整合封装了32gb hbm2显存,位宽4096-bit,频率1.2ghz,带宽1228.8gb/s,支持ecc。

该卡支持pcie 4.0 x16,具备三条infinity fabric互连总线,峰值带宽92gb/s,整卡热设计功耗300w,双8针辅助供电。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

这块卡的特殊之处还在于顶部设置了桥接金手指,通过桥接器可以将四块卡绑定在一起,而搭配双路的amd霄龙处理器,可以实现八卡并行。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

类似之前的计算卡,甚至是r9 fury x、vega 64/56这样的游戏卡,instinct mi110也是将gpu芯片、hbm芯片整合封装在了一起,不过如今的hbm2单颗容量已达8gb。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

对比cdna(上)、rdna(下)架构图,可以发现二者整体框架有些相似之处,但各种单元模块和布局已经截然不同。

infinity fabric互连总线、显存控制器、pcie 4.0控制器、多媒体引擎、着色器引擎、ace异步计算引擎等等都还在(当然也不完全一样了),而和图形渲染输出相关的都没了,比如图形指令处理器、几何处理器、光栅器、显示引擎、原语单元等等,同时增加了xgmi连接控制器用于多卡互连,一二级缓存也完全不同。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

作为amd gpu的最基本模块,计算单元(cu)也完全不同了,现在叫做增强型计算单元(xcu),组成模块包括调度器、分支与信息单元、12.8kb ecc标量单元、512kb ecc标量寄存器、矢量寄存器、矢量alu操作单元、矩阵数据操作单元、四个矢量/矩阵simd单元、64kb ecc本地数据共享单元、载入/存储单元、16kb ecc一级缓存等等。

显然,这一些都是为计算服务的,而用于图形的着色器、纹理相关单元自然都不见了,即便有些单元名字一样,规格和作用也不同了。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

计算性能方面,fma64/fp64双精度为11.5tflops(每秒1.15亿亿次),fma32/fp32单精度为23.1tflops(每秒2.31亿亿次),fp32 matrix单精度矩阵计算为46.1tflops(每秒4.61亿亿次),fp16 matrix半精度矩阵计算为184.6tflops(每秒18.46亿亿次),bfloat16浮点为92.3tflops(每秒9.23亿亿次)。

这样的一块卡,已经相当于20年前的世界*超级计算机,而体积、功耗都不可同日而语。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

对比nvidia安培架构的最新计算卡a100,amd也给出了一些对比数据,fp32单精度性能领先18.5%,fp64双精度性能领先18.6%,ai与机器学习性能更是领先两倍多,而且功耗低了足足100w。

而对比上代产品mi50,新卡的fp64双精度、fp32单精度性能均提升74%,fp32矩阵性能提升接近2.5倍,ai负载性能更是几乎7倍的飞跃。

当然,除了纸面计算性能优秀,软件开发也必须跟上,尤其是这种计算性的产品。nvidia在这方面要强得多,生态更加稳固和丰富,amd rocm平台正在奋起直追中。

AMD CDNA计算卡架构揭秘:从零起步、三杀NVIDIA

 

- the end -

转载请注明出处:快科技

#amd#radeon instinct#rdna

责任编辑:上方文q