欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  移动技术

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

程序员文章站 2022-11-03 14:42:25
除了面向64位移动计算的cortex-x2、cortex-a710、cortex-a510三款全新cpu ip,arm今天还带来了多达四款新的移动gpu ip,同样启用新的命名规则,分别是mali-g...

除了面向64位移动计算的cortex-x2cortex-a710、cortex-a510三款全新cpu ip,arm今天还带来了多达四款新的移动gpu ip,同样启用新的命名规则,分别是mali-g710、mali-g610、mali-g510、mali-g310。

g710、g510、g310分别定位旗舰、主流、入门级市场,依次取代现有的g78、g57、g310。

g610其实和g710是一回事儿,只是核心数较少时单独使用的名字。

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

这是arm valhall gpu架构的第三代产品,也是第一次完整覆盖高中低端各个领域。

搭配同时发布的cortex-x2/a710/a510 cpu、corelink ci-700一致性互连技术、corelink ni-700芯片网络一起,它们可以构成完整、强大的soc解决方案。

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

虽然架构变化不大,只是继续优化提升,但是这一代mali gpu的性能进步还是很可观的:

g710号称综合性能提升20%、机器学习性能提升35%、纹理性能提升50%、能效提升20%。

g510综合性能提升100%、机器学习性能提升100%、能效提升22%。

g310虽然定位最低但变化最大,号称纹理性能提升多达6倍、vulkan性能提升4.5倍、安卓ui内容性能提升2倍。

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

g710的执行引擎设计和g77、g78十分相似,变化更多是一些细节。

wavefront/warp大小从8翻番到了16,而且每个执行引擎有两个数据路径,最终形成每个核心32个fma。

isa指令集也有了不小的改进,可以更好地满足vulkan等现代gpu的需求,但暂无细节。

g710还新增了一个执行引擎,每个着色器核心的计算性能因此翻番,同时每核心每时钟周期的不同吞吐量也有4倍、8倍的增加。

纹理单元也是全新的,每时钟周期可以处理最多80亿纹理,再加上面积优化,单位密度纹理性能提升了50%。

16宽度执行单元单实例变成了4宽度四实例,整体吞吐量不变,但是资源分配更合理,效率更高。

新的执行引擎每核心每时钟周期fma翻了一番,同时功耗也优化降低了20%。

另外,传统的工作管理器(job manager)变成了新的“指令流前端”(command stream frontend),负责调度和处理draw-call,还第一次带来了固件层,与硬件紧密配合处理主机需求。

g710可以配置8-16个不同核心数,g610则是最多6个核心,另外二级缓存可以配置2个或4个区块,每个区块256kb或者512kb, 也就是整体最小512kb,最多2mb。

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

g510支持2-6个核心配置,每核心每执行单元的配置也可以定制,纹理单元也大大加强。

执行引擎还是2个,但也可以配置为只用1个,每时钟周期64 fma会因此减少到48 fma。

arm列举了g510 10种可能的不同规格配置,计算能力、填充率各有不同,适合不同应用需求。

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

g310虽然定位最低,但这次升级力度最大,终于抛弃了古老的bifrost架构。

它因此有了新的执行引擎设计,支持灵活的规模配置,每核心可以有16、32、48、64 fma,纹理单元最低则是每时钟周期2个。

不过,g310仅支持单核心设计。

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

ARM连发四款Mali GPU:一律全新架构、性能飞跃最多6倍

- the end -

转载请注明出处:快科技