欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

程序员文章站 2022-04-05 11:09:46
上回书说到,intel alder lake 12代酷睿将采用全新的大小核混合架构设计,其中大核/性能核(p-core)基于golden cove架构,最多8个,小核/能效核(e-core)基于gra...

上回书说到,intel alder lake 12代酷睿将采用全新的大小核混合架构设计,其中大核/性能核(p-core)基于golden cove架构,最多8个,小核/能效核(e-core)基于gracemont架构,最多也是8个。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

两种架构的核心有何差异?一年一度的架构日活动上,intel终于揭开了它们的神秘面纱。

当然,cpu架构设计是极为高深的,一般人把握不了,也无需研究太多,我们这里大致过一下最关键的一些技术点。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

golden cove是此前10代酷睿sunny cove、11代酷睿移动版willow cove、11代酷睿桌面版cypress cove的进一步升级版,但变化非常大,大量基础模块都重构或升级,其设计理念也将影响未来多代产品的演化。

负责指令拾取和解码的前端部分,就发生了翻天覆地的变化,号称近十年来的最大变革,堪比当年的skylake,官方称它旨在提高速度、突破低时延和单线程应用程序性能的限制。

最直接、最明显的就是解码器宽度由4个升级为6个,这可是x86架构的第一次,同时每时钟周期执行uop从6个增至8个,解码长度从16字节翻番至32字节。?op缓存、队列也都大大强化,缓存可达4k,队列每线程可处理72条目,单线程达144个。

编码预取大大增强,分支目标从5k增至12k,4k itlb、2k/4m itlb分别翻番至256、32,同时改进了分支预测精度,编码预取机制更加智能。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

乱序引擎部分,同样更宽、更深、更智能,分配由5路增至6路,执行端口由10个增至12个,调度器尺寸增大,重排序缓冲区(rob)从352条目增至512条目,两倍多于amd zen3,仅次于苹果m1(大约630条目),重命名和分配阶段也可以执行更多指令。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

整数执行引擎部分,增加了第五个整数执行端口,所有五个端口都可以执行alu、lea,理论上就原生alu吞吐能力而言是最宽的x86内核。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

矢量执行引擎部分,增加了新的快速加法器(fadd),比传统fma单元效率更高、延迟更低,fma单元则增加支持fp16浮点数据类型,属于avx-512指令集的一部分。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

载入和存储部分,通过载入agu增加了一个专用的执行端口,这样载入端口从2个增至3个,同时载入缓冲和存储缓冲更深,载入延迟更低,而针对当今负载不断增加的内存级并行需求,数据处理能力也大大增加。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

二级缓存,桌面和移动端每核心还是1.25mb,服务器端的sapphire rapids则增加到2mb,并支持多路径预取、全写入预测带宽优化,可减少内存读取。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

intel宣称,golden cove架构相比于现在11代酷睿桌面上的cypress cove,实现了平均大约19%的ipc(每时钟周期指令数)提升,可以理解为同频性能的提升幅度。

它还支持amx高级矩阵扩展指令,内置下一代ai加速技术,用于学习推理和训练,包括专用硬件和新指令集架构,可明显提高矩阵乘法运算。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

gracemont小核心属于atom凌动家族,是2008年以来的第七代,之前分别是bonnell、saltwell、silvermont、airmont、goldmont(包括plus版本)、tremont。

按照intel的说法,gracemont核心非常迷你,一个golden cove大核心的空间里,可以放入四个gracemont小核心,以及它们共享的4mb二级缓存。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

别看是小核心,性能其实一点都不弱。intel声称,单核单线程对比,gracemont的同频性能相比六代酷睿skylake提升超过40%,而同等性能下功耗则可降低40%。

四核四线程的gracemont对比双核四线程的skylake,峰值性能可提升80%,而同等性能下功耗可降低80%。

intel表示,这种小核心设计可以在有限的芯片空间内,实现多核任务负载,并具备宽泛的频率范围,降低整体消耗,为更高频率运行提供果功耗和散热空间,满足更多动态任务负载。

它还可以利用各种技术进步,在不额外增加功耗的情况下,对工作负载进行优先级排序,并直接提升性能。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

架构方面,小核心就相对简单不少了,但变化也非常大,比如指令缓存增大至64kb,可在不耗费内存子系统功率的情况下保存可用指令,还有intel的第一个按需指令长度解码器,可生成预解码信息,加速现代工作负载。

同时借助更深的分支历史、更大的指令尺寸,分支预测精度大大增加,拥有5000个条目的分支目标缓存区。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

后端也更宽了,具备5组宽度分配、8组宽度引退、256个乱序窗口入口、17个执行端口,以及4个整数alu、2个载入agu、2个存储agu、2个跳转端口、2个整数存储数据、2个浮点/矢量存储、2个浮点/矢量堆栈、以及第3个矢量alu。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

内存部分,使用了双载入、双存储单元的配置,二级缓存增大至4mb,以及深度缓冲、高级预取器,支持intel resource director资源重定向技术,可以让软件在不同核心、不同软件线程之间实现精准的控制。

哦对了,gracemont是第一个支持avx2指令集的能效核心,还支持整数ai操作新扩展、intel控制流强制技术、intel虚拟化重定向保护技术。

Intel 12代酷睿大小核架构探秘:小核性能暴涨80%

- the end -

转载请注明出处:快科技