欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  移动技术

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

程序员文章站 2022-05-09 23:28:45
今天,arm发布了2020年度新品家族,包括纯粹64位的超大核心cortex-x2、大核心cortex-a710、小核心cortex-a510(分别取代x1、a78、a55),三级缓存和丛簇设计dsu...

今天,arm发布了2021年度新品家族,包括纯粹64位的超大核心cortex-x2、大核心cortex-a710、小核心cortex-a510(分别取代x1、a78、a55),三级缓存和丛簇设计dsu-110,互连网格网络ip ci-700,芯片网络ip ni-400。

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

今年3月底,arm正式发布了64位指令集armv9,号称10年来最重要的创新,ipc性能提升多达30%。

4月底,我们看到了armv9指令集的首个产品,面向数据中心的neoverse n2(同时还有32位的nerovers v1)。

现在,armv9首次来到了消费级市场,而且同时用于三种不同级别的核心,上来就是完整的一整套解决方案。

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

先来看超大核心x2,仅支持aarch64 64位指令而不再兼容32位,拥有全新层级的性能。

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

前端方面,分支预测与预取单元解耦分离,从而可以在内核之前提前运行,从而减少预测错误,同时改进了分支预测精度,提升了大型指令负载的性能。

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

核心方面,流水线长度从11个指令周期减少到10个,其中分派阶段从2个周期减少到1个,这可是个非常大的变动。

同时,乱序执行窗口增大了最多30%,244条增至最多288条,再加上指令压缩和绑定,实际还可以保存更多。

fp/asimd流水线现在支持sve2,矢量长度为128b,可以大大提升机器学习性能。

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

后端方面,载入存储窗口和结构增大了33%,可以提升内存级并行度,一级缓存d-tlb也增大了20%,另外增强了数据预取能力。

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

性能方面,arm宣称x2相比于x1整数性能提升16%,机器学习性能则可以翻一番,不过注意对比时x2的三级缓存容量为8mb,增大了一倍。

x1核心何时商用取决于芯片厂商,不过arm提到它正在用于笔记本等大屏计算设备,显然已经有了不少设计,只待宣布。

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

延伸阅读:

arm a710、a510大小核齐发:专为中国保留32位兼容、性能暴涨62%

ARM Cortex-X2超大核心发布:纯粹64位、机器学习性能翻番

- the end -

转载请注明出处:快科技