欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

10nm IceLake落地 英特尔10代酷睿了解下

程序员文章站 2022-05-17 22:29:11
在中国人的观念里,“10”这个数字象征着完美,十全十美是对于人或事物的最高评价。 10,对于英特尔来说同样重要。10nm关系着英特尔在半导体芯...

在中国人的观念里,“10”这个数字象征着完美,十全十美是对于人或事物的最高评价。

10,对于英特尔来说同样重要。10nm关系着英特尔在半导体芯片行业未来能否更进一步,10代酷睿也关系到英特尔能否正面迎接来自竞争对手、来自舆论的压力。

而将10nm与10代酷睿联系在一起,能够做到十全十美呢?

接下来,让我们通过对英特尔10nm icelake 10代酷睿处理器技术细节解析,来找找答案。

在10nm制程之前,英特尔严格遵循摩尔定律以及tick-tock战略,通过制程工艺与架构技术迭代来稳步推进pc半导*程技术与性能的发展。

65nm到45nm用时2年,45nm到32nm用时3年,32nm到22nm用时2年,22nm到14nm同样用时2年,然而在14nm到10nm推进过程中,英特尔却经历了更久的时间——4年。

随着制程工艺不断演进,相关技术迭代速度也逐渐放缓。

光刻机技术、晶体管技术、新材料等诸多领域的研发速度放缓,加之英特尔对10nm制程额外看重,希望通过10nm技术积累为10nm到7nm制程演进做铺垫,因此耗费了更久的时间。

10nm IceLake落地 英特尔10代酷睿了解下
10nm icelake晶圆

10nm IceLake落地 英特尔10代酷睿了解下

不过,时间终究是推动历史前行的车轮,英特尔10nm制程工艺,以及英特尔第10代酷睿处理器,即将与我们见面!

一、10nm icelake制程架构特性解析

首先我们需要弄清楚两个问题:

其一,英特尔10nm制程工艺代号为icelake,但架构名称不再用icelake来统一命名,其架构名称为sunny cove。

其二,英特尔10nm icelake处理器正式落地之后,没有意外的话,首批将全部是移动级处理器。

也就是u系列或y系列处理器,暂时没有桌面级处理器,这也意味着英特尔第九代酷睿没有u/y系列低电压处理器,同时新的桌面级处理器很可能依旧是14nm制程,此前曝光代号为comet lake。

接下来我们看看10nm制程架构的详细特性:

首先来看icelake平台。全新的10nm icelake平台在性能表现上借助了ai功能,支持dl boost、支持dynamic tuning机器学习,它能够动态地分配gpu与cpu的负载与功耗,虽然并非10nm平台新技术,但对于icelake处理器的性能表现有明显的帮助。

此外,10nm icelake平台全面支持雷电3接口、wi-fi 6无线通信模块、4k 60fps hdr视频播放、更快的、更高质量的hevc编码,并借助全新的gen 11核显,支持1080分辨率电竞游戏的流畅运行。

10nm IceLake落地 英特尔10代酷睿了解下
icelake平台特性

在新特性方面,10nm icelake平台具备以下几点:

一、全新的sunny cove微架构;

tips:以下是关于sunny cove微架构技术特性的分析

sunny cove微架构主要聚焦在st单核性能、全新isa及并行性三个方面的优化和改进,sunny cove微架构主要解决以下四个问题:

其一、增强的微架构,可并行执行更多操作。

其二、可降低延迟的新算法。

其三、增加关键缓冲区和缓存的大小,可优化以数据为中心的工作负载。

其四、针对特定用例和算法的架构扩展。例如,提升加密性能的新指令,如矢量aes和sha-ni,以及压缩/解压缩等其它关键用例。

对于处理器来说,ipc强弱与cpu性能有直接关系。英特尔在sunny cove微架构ipc性能提升方式上给出了三个字:更深(deeper)、更宽(wider)、更智能(smarter)。

更深方面,sunny cove微架构表现在l1容量的增加,从32kb增加到48kb,而且l2缓存、uop、tlb缓存都更大;

更宽主要体现在执行管线上,sunny cove微架构分配单元从4个增加到5个,执行接口从8个增加到10个,l1 store带宽翻倍。

而想要让更深、更宽发挥出应用的实力,那么就需要有更好的算法。sunny cove的smarte就是为此而设计。

英特尔研究院院长宋继强在解答这个问题时主要提及两个方面,其一是提高分支预测精度,其二是减少延迟。

另外英特尔还为sunny cove微架构配置了加密解密指令集,并在ai、存储、网络、矢量等方面进行全方位改进。

因此对于pc用户来说,无论是消费级还是服务器用户,sunny cove微架构带来的变化要比10nm这个制程节点数据更有意义。

10nm IceLake落地 英特尔10代酷睿了解下
sunny cove微架构示意图

二,高带宽、低延迟特性;

三,全新的内存控制器,支持lp4/x-3733和ddr4-3200高速内存;

四,搭载性能更强,最高拥有64eu、1tflop运算能力的gen 11核芯显卡;

五,支持10bit 4k 60fps、10bit 8k 30fps视频编码;

六,支持5k 60fps或4k 120fps、dp 1.4以及bt.2020色域

七,高达16mp图像处理器单元。

从新特性来看,10nm icelake平台的主要升级点除了新架构之外,最重要的是提升了图形、显示部分的性能表现。

10nm IceLake落地 英特尔10代酷睿了解下
10nm制程工艺新特性及芯片架构示意

10nm icelake将pch封装到一个芯片上,而pch芯片则由14nm制程工艺打造。集成wi-fi 6 gig+和新的电源管理,整合802.11ax,并能够更好的控制cpu和pch的能耗和功耗。

10nm IceLake落地 英特尔10代酷睿了解下
pch采用14nm工艺打造

此外,audio dsp是英特尔第8代酷睿时候就具备的功能,它的主要作用是支持低功耗下的语音唤醒。

而相对于8代酷睿来说,英特尔对10代酷睿的audio dsp做了进一步优化,在功耗表现更好。另外在i/o接口方面没有新的变化。

二、10代酷睿处理器封装规格与基本参数

了解了制程架构相关信息之后,我们来看看英特尔10代酷睿的相关规格。

首先来看处理器封装规格。英特尔10代酷睿针对9w和15w功耗处理器进行了不同规格的封装,9w处理器芯片规格为26.5 x 18.5×1.0mm,针脚间距0.43mm;15w芯片规格为50×25×1.3mm,针脚间距0.65mm。二者均采用bga封装,插槽规格分别为1526和1377。

10nm IceLake落地 英特尔10代酷睿了解下
处理器封装规格

10nm IceLake落地 英特尔10代酷睿了解下
两种尺寸的10代酷睿芯片

10nm IceLake落地 英特尔10代酷睿了解下

英特尔10代酷睿首批产品拥有酷睿i3、酷睿i5以及酷睿i7三个型号,没有酷睿i9。tdp主要为9w、15w、28w,采用4核8线程,缓存为8mb,最高频率4.1ghz。

其中,英特尔酷睿i3全部、以及酷睿i5绝大部分处理器显卡为uhd核显,酷睿i5极少数型号以及酷睿i7最高支持英特尔iris plus核显,且最高支持64eu锐炬核显。

此外前面也提到了,10代酷睿支持lp4/x-3733以及ddr4-3200规格高速内存条。

10nm IceLake落地 英特尔10代酷睿了解下
英特尔10代酷睿基本参数

tips:关于基本参数的分析

从基本参数来看,英特尔10代酷睿在核心数上与第8代酷睿相比没有变化,tdp基本保持一致。9w主要放在y系列上,相对8代酷睿的amber lake y系列7w tdp来说,略有提升。

15w主要放在u系列处理器上,与8代酷睿相比保持不变。

不过细心的朋友可能发现了,英特尔10代酷睿频率有所下降,max turbo最高到4.1ghz,这可能会导致英特尔10代酷睿在跑分上与8代酷睿相比提升较少。

另外,之所以降低频率,主要原因是一部分tdp分配给了gen 11核显,为了平衡功耗,降低主频是必须去做的妥协。

三、gen 11核显规格分析

gen 11核显是英特尔10代酷睿非常重要的一个新要素。在年初的ces上,英特尔透露了gen 11核显的基本信息。

在架构层面,英特尔gen 11核显最高集成64个执行单元(eu),而第9代核显只有24个。

它们分为四个区块(slice),各有两个媒体取样器、一个pixelfe、载入/存储单元,每个区块又细分为两个子区块(sub-slice),都有自己的指令缓存、3d取样器。

10nm IceLake落地 英特尔10代酷睿了解下
gen 11核显架构渲染图

英特尔对eu内的fpu浮点单元进行了重新设计,不过fp16单精度浮点性能没有变化,同时每个eu继续支持七个线程,共512个并发流水线,同时重新设计了内存界面,三级缓存增大至3mb。

另外gen 11核显支持adaptive sync(适应性同步)技术,相对于nvidia g-sync来说成本更低。

伴随gen 11核显而来的,还有全新的显卡控制界面。该界面除了针对显卡的各项调试功能之外,还支持超过40款游戏的入库和快捷启动。同时我认为,全新的显卡界面也是在为英特尔xe独显做准备。

10nm IceLake落地 英特尔10代酷睿了解下
全新的显卡控制面板

10nm IceLake落地 英特尔10代酷睿了解下
command center细节

tips:关于gen 11核显更多信息

其实除了最大的64eu规格,再向下也有32eu规格核显,主要放在酷睿i3和低端的酷睿i5处理器上。

iris plus也是10代酷睿的一大亮点,64eu主要放在酷睿i7处理器上。另外,高端的酷睿i5处理器和酷睿i7处理器也会搭载iris核显。

此外,显卡主频提升到了1.1ghz

四、10nm icelake创新生态解读

与以往新制程平台单纯聚焦处理器芯片不同,英特尔10nm icelake更强调整个创新生态。因此在10nm icelake处理器、gen 11核显之外,wi-fi 6 gig+、optane h10混合固态盘、thunderbolt 3扩展以及ai层面的性能、功耗辅助等,应该与处理器放在一起去看,这才是一个完整的10nm icelake。

首先来说thunderbolt 3。

3月初,英特尔宣布向usb promoter group开放thunderbolt协议规范,从这一刻开始,无论是pc设备、平板设备,还是任何形式的外接扩展设备,都可以免版税的形式构建兼容thunderbolt标准的芯片。与此同时,usb promoter group宣称将发布基于thunderbolt协议的usb 4规范。

这意味着,在该标准协议框架下,usb 4物理连接器将与thunderbolt 3和type-c相同,带宽方面得到提升,达到40gbps,这与thunderbolt 3接口一致,也就是说,usb 4规范将兼容thunderbolt 3。

10nm IceLake落地 英特尔10代酷睿了解下
雷电3接口功能强大

thunderbolt 3是目前最强的物理接口,双向带宽达到40gbps,是现有速度最快的usb type-c 3.1 gen 2接口的四倍,且雷电3接口支持4k 60fps视频传输,支持100w pd协议供电,支持外接桌面级显卡,因此可以说是目前最为强大的接口扩展标准。

10nm IceLake落地 英特尔10代酷睿了解下
现有的雷电平台架构

10nm IceLake落地 英特尔10代酷睿了解下
全新的雷电平台架构,主要优化了cpu和pch通路,使其具备更高的效率

在10nm icelake平台上,英特尔对thunderbolt 3架构做了新的优化,对比上面两张架构图,其实大家可以很明显的看出以往和现在雷电平台架构的差异。主要就是优化了cpu、pch到接口物理层的结构,使得数据传输效率更高,延迟更低。

同时,英特尔在10nm icelake平台上直接植入thunderbolt 3,包括入门级的酷睿i3平台。

wi-fi 6 gig+也是英特尔10nm icelake的重要组成部分。

目前,wi-fi 5为802.11ac标准,qam最高为256;wi-fi 6为802.11ax标准,qam最高为1024。拥有更快的响应速度、更强的稳定性和更快的速度。延迟降低75%、覆盖范围提升4倍,支持更多设备的稳定连接。

性能方面,160mhz频宽wi-fi 6 gig+最高可以做到1.68g传输速度,相对于80mhz频宽标准的2×2 wi-fi 6有3倍的速度优势。同时相对于80mhz频宽标准2×2 ac而言,速度提升40%。

10nm IceLake落地 英特尔10代酷睿了解下
标准2×2 ac与ax速率对比

英特尔wi-fi 6无线网卡拥有两种规格,采用了全新的设计,如下:

10nm IceLake落地 英特尔10代酷睿了解下

左侧是基于14nm制程打造2230规格无线网卡,右侧是基于28nm制程打造的1216规格网卡。

总体来说,英特尔wi-fi 6具有以下两大明显优势:

其一,支持多设备连接,更稳定;

其二,对延时有更好的管理和控制。

年初ces,英特尔公布了全新的傲腾h10混合固态盘,相对于以往的optane memory来说,傲腾h10混合固态盘主要在于把optane memory与英特尔qlc固态硬盘整合在了一起。

因此将optane memory的非易失性存储特性以及低延迟、快速响应、性能一致性等特点。与英特尔qlc 3d nand技术的高单元密度、低成本特性,很好的结合在了一起。

10nm IceLake落地 英特尔10代酷睿了解下

作为10nm icelake生态上的重要一环,英特尔傲腾h10混合式固态盘,可将文档打开速度提高2倍;多任务处理状态下,游戏启动速度提高60%;媒体文件打开速度提高90%。

相对于普通nand固态硬盘而言,傲腾混合式固态盘拥有更快的速度、更好的性能。

与独立的tlc 3d nand固态盘系统相比,英特尔傲腾混合式固态盘不仅能够更快地访问常用应用和文件,还能加速后台活动的响应。

傲腾h10混合固态盘拥有三种规格:16gb(英特尔傲腾内存)+256gb(存储)、32gb(英特尔傲腾内存)+512gb(存储)、32gb(英特尔傲腾内存)+1tb存储。

五、10nm icelake性能标准

目前,英特尔10nm icelake只是处在发布状态,产品还未正式落地,不过10nm整体进程的推进速度应该有所加快。所以在性能层面,目前我们只能通过英特尔的官方数据来窥知一二。

英特尔在发布10nm icelake处理器与gen 11核显的同时,特意强调了1080p电竞游戏的流畅运行。

通过下面图标可见,搭载intel iris plus核显的10代酷睿处理器能够在相应的画质模式下,较为流畅的运行一些常见的电竞游戏,如cs:go、彩虹六号、坦克世界、堡垒之夜等,相对于现阶段8代酷睿的uhd 620核显来说,图形性能提升还是比较大的。

10nm IceLake落地 英特尔10代酷睿了解下

在处理器性能上,英特尔目前只给出了15w单线程的表现,从下图可见,10代酷睿性能提升接近1.5倍,大概为1.48倍左右。如果以相邻代数性能提升倍数做参考的话,性能提升幅度不算很大。

10nm IceLake落地 英特尔10代酷睿了解下

ipc是处理器性能的重要指标。sunny cove微架构为10代酷睿带来了18%的ipc性能提升,相对于skylake微架构有1.4倍的提升。

另外这里需要说明的是,英特尔给出的ipc提升18%数据是通过5个benchmark测试出来的结果,18%是一个平均下来的水平线。

另外,结合单线程1.48倍性能以及之前提到的主频来看,其实可以看出英特尔10代酷睿为了保证gen 11核显的性能,因此将cpu与gpu之间的功耗分配做了一定的平衡。

10nm IceLake落地 英特尔10代酷睿了解下

此外,10代酷睿在引入ai加速之后,能够更好的动态控制能耗和功耗,智能化的挑选最优核去做高负载任务,给处理器核心效率(注意是核心效率)带来不小的提升。

英特尔ai加速有三个层面:一是cpu通过深度学习降低延时;二是也可以用gpu来进行智能的应用加速;三是拥有更好的性能表现。

tips:关于英特尔ai加速功能的说明

英特尔ai加速功能主要是通过ai技术,分析并判断出哪些核心处于最优状态,在高负载任务时会优先选择这些核心来承担负载。

而以往英特尔加速功能是随机选择核心来承担负载,这些核心可能并未处在最优状态,所以有可能造成效率的滞后。

10nm IceLake落地 英特尔10代酷睿了解下

六、结语

英特尔10nm制程工艺可谓是“千呼万唤始出来”,而英特尔第10代酷睿又是第一代10nm制程落地的产品,所以其重要性不言而喻。

无论是关注这个领域的普通消费者,还是行业内的合作伙伴,亦或是竞争对手都在盯着英特尔10代酷睿,其最终表现究竟如何,还是需要产品上市之后再做检验。

10nm IceLake落地 英特尔10代酷睿了解下

不过,英特尔通过10代酷睿给业界带来了一个新的信号,即生态化、平台级的创新或将主导未来pc产业的方向。

伴随10代酷睿处理器,英特尔还带来了新的无线网络技术、新的存储技术、新的ai技术、更强大的图形技术以及最先进的接口技术,这些技术将为基于10代酷睿平台打造的pc产品带来全方位的体验,而不仅仅是局限在处理器一个部件上的比拼。

其实对于占比极大的普通消费者来说,处理器计算能力已经足够满足90%以上的应用需求。

相反,存储瓶颈、接口瓶颈、网络瓶颈却在影响着我们的体验、制约着效率的提升,wi-fi 6、thunderbolt 3、optane h10正式解放这些瓶颈的关键所在,相比一味提升处理器性能,全方位的提升才能带给我们体验更好、更全面的设备,这才是英特尔10nm、10代酷睿的价值所在。

10nm IceLake落地 英特尔10代酷睿了解下