欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

程序员文章站 2022-05-16 09:34:06
对前沿半导体感兴趣的人都知道,intel最新的制造工艺已经跳票许久了。10nm工艺首次发布是在2014年,最初定于2016年量产,但却一直延期至今。虽然首批使用10nm...

对前沿半导体感兴趣的人都知道,intel最新的制造工艺已经跳票许久了。10nm工艺首次发布是在2014年,最初定于2016年量产,但却一直延期至今。虽然首批使用10nm工艺的移动处理器在2017年底出货,却是以“特供”笔记本电脑的形式与国内一些大学合作推出。

intel的10nm处理器属于第8代酷睿系列,型号是i3 8121u。该处理器的ark页面(intel的在线数据库)已经公开,其核心代号为cannon lake,属于14nm skylake核心的改良版,于2018年第二季度正式发布。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

i3 8121u的tdp为15w,双核四线程设计,基础频率2.2ghz,睿频频率3.2ghz。这比同为15w的14nm kaby lake处理器甚至还要更低一些。最为新奇的是,虽然这是一颗移动处理器,却支持服务器和高端桌面平台处理器才有的avx-512指令集,可以像企业级硬件一样处理向量运算。

i3 8121u的频率不进反退,让人们对intel 10nm工艺的实际性能表现产生了丝丝疑虑。雷锋网从外媒semiaccurate的一篇研究文章中获悉,目前(指i3 8121u推出时)intel的10nm工艺还存在很多问题和困难,其收益只有10%,远低于预计中的60%,其中saqp、coag、cobalt和调优等环节远远落后于计划和预期。

其后的几个月,坊间传闻intel 10nm工艺严重受阻,甚至将要放弃10nm的研发工作,也有传闻称intel将降低标准以实现这一制程,但都被intel一一辟谣。好在今年的ces上,intel展示了10nm工艺的全新sunny cove架构ice lake处理器,算是让关注新制程的人们吃了一颗定心丸。

从测试结果来看,两款不同核心的处理器性能相差无几,kaby lake核心的i3 8130u在与simd相关的462.libquantum和470.lbm测试项中似乎比cannon lake核心的i3 8121u更有优势,这也许与二者内存延迟性能有关。

10nm工艺难在哪?

2017年9月,intel在技术与制造日上展示了一个10nm cannon lake芯片的完整300mm晶圆,外媒techinsights测得该芯片的芯片面积约为70.5mm?,也就是说,i3 8121u是intel迄今为止最小的双核处理器,但与当时的skylake处理器(六代酷睿)相比,i3 8121u采用了cpu和gpu分离的设计,集成度更低。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

业内衡量半导体工艺好坏的常用标准之一,是芯片中每平方毫米集成度晶体管数量有关。cpu中并不都是运算晶体管,还有sram单元,以及一些被设计成区域间热缓冲区的“死”硅。晶体管的计数也有不同的方法,一个2输入的nand逻辑单元比一个复杂的扫描触发器逻辑单元要小得多。

intel将单位面积上的晶体管数量划分为2输入nand单元和扫描触发器单元,其中2输入nand单元的晶体管密度是90.78mtr/mm?(百万晶体管每平方毫米),扫描触发器单元的密度为115.74 mtr/mm?,在为其赋予60/40的权重后计算出10nm工艺的晶体管密度为100.8mtr/mm?,是14nm工艺37.5mtr/mm?的2.7倍。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

intel还在国际电子器件会议上披露,具体取决于所需的功能,10nm工艺的逻辑库有10种类型,包括短库(高密度库),中高库(高性能库)和高库(超高性能库)等。库越短,电路功耗越低,晶体管密度越高,但峰值性能也越低。因此intel的10nm工艺其实有多种不同的密度,实际上只有密度最高的短库可以达到100.8mtr/mm?。

在实际芯片制造中,通常会混合使用多种库,较短的库适用于i/o和非核心区等对性能不敏感的部位以节约成本,较高的库通过较低的密度和较高的驱动电流,通常使用在对性能敏感的核心区域。

为了更好的理解intel 10nm工艺,首先要讨论fin(鳍)、gate(栅极)、单元机制,以及定义与晶体管和finfet相关的一些术语。

晶体管的源极-漏极由鳍(灰色)提供,该鳍穿过栅极(绿色)并嵌入氧化物中,这里的关键指标是鳍的高度、宽度和栅长,半导体工艺的目标是使每一个都尽可能小、单元性能尽可能高。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

intel在其22nm工艺中,使用了包含多个鳍片的三栅极晶体管来增加总驱动电流,以获得更好的性能。这就引入了一个新的度量:“鳍间距”,即鳍之间的距离。如果一个鳍通过了多个栅极,栅极之间的距离称为“栅极距”。

鳍和栅极之间接触的越多,鳍间距越小,泄漏就越低,性能也就越好,这可以增加驱动电流,也能控制寄生电容和栅电容。其后的14nm工艺中,鳍的高度、宽度和栅长都变得更短,每个鳍穿过的栅极也更多,因而获得了更好的性能。

而到了10nm工艺,intel也在积极设计鳍结构,鳍间距从42nm缩减到34nm,鳍宽度从8nm缩减至7nm以避免寄生电容。改动看起来并不多,但在这个尺度上每nm都非常重要。intel还通过添加共形钛层来改善源极和漏极扩散区域,鳍和沟槽之间的接触区域(栅极下方的灰色尖头)也需要让接触电阻最小化。在10nm工艺中,intel将其从钨接触改为钴接触,使接触线电阻降低了60%,种种这些改进,让技术变得极其具有挑战性。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

鳍与栅极组合起来就是基本的电路单元,从22nm制程的扫描电子显微镜的图像来看,单元有6片鳍的和2片鳍的(当然也有其他规格的),栅极长度不尽相同,每个单元内都有活跃的鳍传递电流和非活跃的鳍作为间隔。

在10nm工艺上,使用高密度库的单元总共有8个鳍,其中5个是活动鳍,这些单元可用于i/o等不需要很高性能或对成本敏感的电路部分。高性能库和超高性能库则分别有10个和12个鳍,各自相比前者多出一个额外的p鳍和n鳍,有助于提供额外的驱动电流,以适当的效率牺牲来换取峰值性能的提升。

在单元之间,通常会有许多作为间隔物的伪栅极。在intel 14nm工艺中,每个单元的两端都有一个伪栅极,这意味着两个单元之间会有两个伪栅极。而在10nm工艺中,两个相邻的单元可以共享一个伪栅极,这将带来更大的密度优势,intel表示最多可节约20%芯片面积。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

晶体管内部,栅极通常靠两支长度略微超出单元尺寸的触点给源极和漏极加电,这不可避免的要占据额外的平面尺寸。在10nm工艺中,至少在目前cannon lake处理器使用的版本中,intel通过一种被称为“有源栅极接触”(coag)的设计,将栅极触点垂直放置在单元上。这一设计为制造过程增加了好几个步骤(一次蚀刻、一次沉积和一次抛光),但可以为芯片提供大约10%的面积缩放。

前文已经言道,外媒semiaccurate上的一篇研究文章曾表示,coag是一种风险较高的实施方案,虽然intel已经把它造出来并且正常工作了,但它并不像预期的那样可靠。用于cannon lake核心的coag似乎只能运行在低性能&低功率,或高性能&高功率的工况下,希望未来intel能在新一代10nm ice lake处理器正式发售时详细说明关于coag的改进情况。

回到晶体管密度上,衡量晶体管密度的另一种方法是cpp*mmp,即将栅间距(接触多晶硅间距contact poly pitch)乘以鳍间距(最小金属间距)。种种这些改进加在一起,使intel的cpp*mmp尺寸只有54nm*44nm,相比台积电和三星的7nm也只是略输一点点,这也是intel一直强调前两者只是商业命名的原因。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

揭开架构之秘

虽然i3 8121u的cannon lake核心仍处于nda中,但经过科技圈众多同仁一年以来孜孜不倦的研究,终于还是基本揭开了其架构的面纱。

整体而言,cannon lake核心的设计很像是pc端skylake核心与服务器端skylake-sp核心的混合体。虽然它使用了pc端标准的4+1解码单元、8个执行单元以及l1+l2+l3缓存结构,但也从服务器端引入了一个avx-512单元,并且l1数据缓存的读写速度分别达到了每周期2*512byte和1*512byte。

进一步来看,cannon lake核心也体现了一小部分第二代10nm sunny cove架构的设计,一些skylake和skylake-sp核心上没有的指令,在cannon lake和sunny cove上都有存在。

除此之外,虽然目前不太清楚cannon lake核心的架构前端设计变化,但还是可以看出重排序缓冲区的大小是与skylake核心相同的224条微指令,而sunny cove架构的大部分特性改进(存储带宽加倍、执行端口更多以及执行端口功能改进)都没有出现在cannon lake核心上。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

cannon lake支持的新指令包括ifma(integer fusion multiply add,整数融合乘加法)、vbmi(vector byte operation instructions,矢量字节操作指令),以及基于硬件的sha(secure hash algorithm,安全哈希算法)等。

其中,ifma是52位整数融合乘法加法(fma),其行为与avx512浮点fma相同,延迟为4个时钟周期,每个时钟周期的吞吐量为2(对于xmm/ymm/zmm为4和1)。该指令通常被用于辅助加密功能,但也意味着可以执行任意精度的算术运算。

vbmi指令集提供了vpermb、vpermi2b、vpermt2b和vpmultishiftqb四条指令,在字节混洗方案中非常有用。

而硬件加速sha则纯粹是为加密算法加速而设计的,不过测试表明,cannon lake核心有了它后速度仍然比goldmont(下代atom处理器的核心)和amd的zen都慢,这意味着起码基于硬件的sha在i3 8121u上并不是特别有用。

除了增加新指令,intel通常还会在新核心上改进现有的指令,用于增加吞吐量或减少延迟(或两者兼而有之)。cannon lake核心还支持vector-aes特性,它允许aes指令一次使用更多的avx-512单元从而使吞吐量倍增。

在cannon lake核心上,最大的变化是可以硬件支持64位整数除法,不再需要分割成几条指令,18个时钟周期内就可以完成64bit的idiv。相比之下,zen执行同样的运算需要45个时钟周期,skylake核心则需要97时钟周期。

对于字符串的块存储,所有rep stos*系列指令都可以使用512bit执行写入端口,吞吐量为每时钟周期61bit,相比之下,skylake-sp为43bit,skylake为31bit,zen为14bit。

对于全字整数矢量,avx512bw命令vpermw的等待时间从6个时钟周期减小到4个,并且每个时钟的吞吐量增加一倍。与向量类似,使用vmovss和vmovsd命令移动或合并单/双精度标量的向量现在与其他mov命令的行为相同。

对指令集的其他有益调整包括使zmm划分和平方根更快一个时钟,并将一些gather函数的吞吐量从每四个时钟一个增加到每三个时钟一个;回归则以旧x87指令的形式出现,其中x87 div、sqrt、rep cmps、lfence和mfence都变慢一了个时钟,其他指令则慢的更多,目的是让人们弃用这些老旧的指令。

cannon lake核心相对不足的地方包括:vpconflict*命令具有3个时钟周期的延迟,吞吐量为每时钟周期一条,速度仍然很慢;dword zmm表单的延迟为26个时钟,吞吐量为每20个时钟1个;不支持skylake-sp核心的缓存行写回功能clwb;不支持sgx(软件保护扩展)。

处理器规格对比

在i3 8121u的测试中,使用i3 8130u移动处理器作为对比,这是一款kaby lake核心的双核四线程处理器,使用14nm工艺制造,tdp同样为15w,基础频率与i3 8121u相同,睿频频率则反而要稍高一些。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

对于这种15w tdp的移动处理器,会很容易撞上温度墙导致降频。测试中i3 8121u降频非常频繁,在avx2应用中干脆是运行在2.2ghz的基准频率状态,avx-512应用中甚至会降频至基准线以下的1.8ghz。

相比之下,使用14nm成熟工艺的i3 8130u在avx2应用中仍能维持2.8ghz的频率,比如在pov-ray测试项中,i3 8130u可以更快的完成测试,性能相比i3 8121u高出26%。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

不过尽管i3 8121u在运行avx-512应用时频率很低,但先进的指令集仍然带来了出色的性能,在3dpm测试中,开启avx-512指令集的i3 8121u在1.8ghz下成绩为3846分,6倍于2.8ghz但只支持avx2指令集的i3 8130u。

内存性能和功耗测试

在缓存/内存延迟测试中,i3 8121u和i3 8130u处理器都禁用了睿频,迫使它们以相同的2.2 ghz频率运行,以便进行奇偶性和直接的架构比较。cannon lake核心的缓存/内存子系统与skylake核心相同的,没有任何其他改进,理论上表现出的性能也应该基本相同。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

在这项测试中,两颗处理器的缓存访问延迟几乎相同,但cannon lake核心的i3 8121u的内存访问延迟要高出kaby lake核心的i3 8130u多达50%,一上来就震惊了四座(当然这不是啥好事)。

尽管为i3 8121u配套的ddr4 2400内存时序17-17-17,略输于i3 8130u的16-16-16 -16,但这一丢丢时序差异远不足以有如此大的影响,能想到的唯一原因是,cannon lake核心访问内存控制器有非常大的额外开销,这或许就是封堵了幽灵和熔断漏洞的副作用。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

而功耗方面比较扑朔迷离,我们知道,intel在处理器硬件中设置了两个关键的功耗限制——pl1和pl2,前者控制稳态功耗,后者控制短时间睿频功耗。

在大多数情况下,处理器的稳态功耗和tdp相同,如i3 8130u就是这样,处理器的稳态功耗为15w,然而同为15w tdp的i3 8121u的稳态功耗仅为12.6w。由pl2控制的峰值功耗也是同样,i3 8130u的峰值功耗可以达到24.2 w,而i3 8121u最高只能冲到18.7w,且睿频的持续时间也要比i3 8130u短很多。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

糟心的是,虽然i3 8121u的功耗墙更低,但由于其频率更低性能更差,实际执行运算所消耗的能量反而更多。在pov-ray测试项中,kaby lake核心的i3 8130u的总耗能只有768 mwh,而cannon lake核心的i3 8121u的总耗能为867mwh,足足高了12.9%。

2.2ghz同频测试:spec2006

除了功耗,关于cannon lake核心的另一个问题在于它是否是一个高效的架构设计。为了进行直接的ipc比较,我们将两颗处理器固定住2.2 ghz同频率上运行spec2006 测试。

spec2006是一个重要的基准测试软件,它与其他测试软件的区别在于所处理的数据集更大更复杂。作为基准测试更有代表性,它可以充分展示架构的更多细节。

从测试结果来看,两款不同核心的处理器性能相差无几,kaby lake核心的i3 8130u在与simd相关的462.libquantum和470.lbm测试项中似乎比cannon lake核心的i3 8121u更有优势,这也许与二者内存延迟性能有关。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

2.2ghz同频测试:系统综合性能

系统测试部分重点关注实际用户体验,将包括应用加载时间、图像处理、简单科学物理、仿真、神经仿真、优化计算和3d模型开发等测试项。

gimp应用加载时间

系统响应速度是最关乎用户体验的指标,一个很好的测试用例是看应用加载需要多长时间。在这一测试中,cannon lake核心的i3 8121u表现的特别好。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

fcat图像处理

fcat软件采用录制的视频,并将颜色数据处理成帧时间数据,以便系统可以绘制可视化的帧率。

这一测试是单线程的,在基准频率下,cannon lake核心的i3 8121u与kaby lake核心的i3 8130u耗时差距在半秒之内,i3 8121u略微领先。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

3dpm粒子运动计算

3dpm测试是一个定制的基准测试,旨在模拟3d空间中六个点的不同粒子运动算法。算法的一个关键部分是使用了相对快速的随机数生成,最终在代码中实现依赖链。在这一测试中,我们在六种算法上运行一个原子粒子集,每次20秒,暂停10秒,并报告粒子移动的总速率,以每秒数百万次运动为单位。

在不启动avx,cannon lake核心的i3 8121u败给了kaby lake核心的i3 8130u。但各自启动avx后,i3 8121u竟然跑出了4519的超高分,甚至击败了4185分的18核core i9 7980xe处理器,非常疯狂。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

dolphin 5.0模拟器

dolphin 5.0是一款gamecube/wii主机模拟器,可以在pc上玩到这些老款游戏主机的独占大作。不过,模拟这两台使用power架构处理器的主机通常需要一颗不弱的处理器才行。

在这一测试中,两款处理器的同频性能大致相同。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

digicortex海蛞蝓大脑模拟

digicortex基准测试最初设计用于神经元和突触活动的模拟和可视化,该软件具有多种基准模式,本次使用小基准测试,模拟32000个神经元和18亿个突触,规模相当于海蛞蝓的大脑。

模拟类型分为“非激发”和“激发”两种模式,前者受内存影响更大,后者更依赖纯粹的处理器性能。测试中使用了后者,两款处理器的同频性能大致相同。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

y-cruncher科学计算

y-cruncher是一款帮助计算各种数学常数的工具,软件支持通过二进制、单线程和多线程等不同优化方式运行,甚至包括avx-512优化的二进制文件。本次测试基于单线程和多线程方式,计算2.5亿位圆周率。

测试结果不出意外是 cannon lake核心的i3 8121u获胜,到目前为止,所有可以利用avx-512指令集的软件都是i3 8121u获胜。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

agisoft photoscan 2d图像转3d模型

photoscan可以将许多2d图像转换为3d模型,这是模型开发和归档中的一个重要工具,依赖于许多单线程和多线程算法。

测试使用了photoscan v1.3.3版本,其中包含了84 x 1800万像素的大数据集,通过一个相当快速的算法变体,最后对比转换过程总时间。

在这一测试中,两款处理器的同频性能大致相同。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

2.2ghz同频测试:渲染性能

渲染性能通常是处理器在专业环境下的关键指标,从3d渲染到光栅化,涵盖网格、纹理、碰撞、锯齿、物理等方面。大多数渲染器都支持cpu渲染,少数可以支持gpu或fpga和asic等专用芯片。对于大型工作室来说,cpu仍然是首选的硬件。

corona 1.3渲染

corona是3ds max和cinema 4d等软件的高级性能渲染器,基准测试的gui可显示正在构建的场景,并将渲染时间反馈给用户。

本次测试使用了直接输出结果的命令行版本,输出的结果也不是报告时间,而是报告六次运行中每秒的平均光线数,因为单位时间内的性能比例通常更容易理解。

corona只支持到avx2指令集,无法充分发挥cannon lake 核心的特性。在这一测试中,i3 8121u同频性能落后i3 8130u约10%。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

blender 3d创作软件

blender是一个开源的高级渲染工具,支持大量可配置项,被世界上许多知名的动画工作室所使用。该软件的开发小组最近发布了一个基准测试包,本次测试通过命令行运行该套件中的“bmw27”场景子测试,并测量完成渲染的时间。

blender同样只支持到avx2指令集,在这一测试中,两款处理器的同频性能大致相同,cannon lake 核心的i3 8121u有微弱优势。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

luxmark引擎

使用luxrender引擎开发的基准测试提供了几个不同的场景和api,本次测试选择在c ++和opencl代码路径上运行简单的“ball”场景,以粗略渲染开始,并在两分钟内慢慢提高质量,最终结果以每秒渲染的光线数展示。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

pov-ray光线追踪

persistence of vision光线追踪引擎是另一个众所周知的基准测试工具,在amd发布ryzen处理器之前一直默默无闻,而后intel和amd都开始向开源项目的主要分支提交代码。

本次测试使用从命令行调用所有内核的内置基准。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

2.2ghz同频测试:办公性能

office测试套件旨在专注于更多行业标准,如办工流程和系统会议等,但是我们也将编译器性能捆绑在本节中。对于必须对硬件进行总体评估的用户来说,这些通常是最需要考虑的基准测试。

3dmark物理计算

游戏测试软件3dmark的每个测试场景均包括一个物理测试子项。按复杂程度排列的依次为ice storm、cloud gate、sky diver、fire strike和time spy。

在所有测试场景中,两款处理器的同频性能都大致相同。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

geekbench 4

geekbench 4是常用的跨平台测试工具,重点寻求峰值吞吐量的一系列算法,包括加密、压缩、快速傅里叶变换、存储器操作、n体物理、矩阵运算、直方图处理和html解析等,常用于移动设备测试。

考虑到其通用性和流行程度,本次也加入了这款软件的单线程和多线程测试。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

2.2ghz同频测试:编码性能

随着流媒体和短视频内容的兴起,越来越多的家庭用户和游戏玩家需要将视频文件进行转换,处理器的编码和转码性能变得越来越重要,本次编码测试也主要围绕这些重要的场景进行。

handbrake视频转码

handbrake是一种流行的开源视频转换软件,最新的版本可利用avx-512和opencl来加速某些类型的转码和算法。本次测试使用的cpu转码。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

7-zip压缩解压

在压缩/解压应用中,开源的7-zip是很欢迎的工具之一。本次猜测是使用最新的v18.05版本,它内置有基准测试,从命令行运行基准测试,报告压缩、解压缩和综合得分。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

winrar压缩解压

在大多数人的系统中通常都有winrar,它是20多年前的第一批压缩解压工具之一。它没有内置基准测试,本次使用一个包含超过30个60秒视频文件和2000个零碎小文件的文件夹,以正常压缩率运行压缩。

winrar是可变线程的,但也容易受到缓存的影响,因此测试需运行它10次并取最后五次的平均值,使结果可以展示cpu纯粹的原始计算性能。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

aes加密

许多移动设备默认使用的文件系统都提供了加密功能以保护内容,pc上的windows也有,通常由bitlocker或第三方软件应用。本次使用已停产的truecrypt作为其内置基准测试,可直接在内存中测试多种加密算法,支持aes指令集但不支持avx-512。测试采用的数据是aes加密/解密组合,以每秒千兆字节为单位。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

雷锋网总结

intel在10nm工艺上确实进行了很多改进,如果每一步都能完美运行,那么10nm应该在去年就成了。可问题是在半导体设计中,有几百个不同的特性,改动任何一个都可能会导致其他几个甚至几十个特性变差,这正是intel在10nm工艺方面遇到的最大问题。

仍记得2018年的ces上,intel对10nm工艺相关的问题缄口不言,从这昙花一现的cannon lake核心来看,唯一称得上亮眼的表现只有avx-512性能,很明显第一代10nm还远远没有准备好迈入黄金时段,intel是在试图冷处理这一代处理器,也肯定不会正式公开发售它们。

意大利炮来了?深度解析Intel初代10nm Cannon Lake处理器

在intel给出的这张图中,右侧显示10nm工艺及其改型可依靠较低的动态电容拥有较低的功率,然而数轴的左侧则显示10nm和10nm+工艺的单个晶体管性能其实还要低于当前的14nm++工艺,要到下下下一代的10nm++工艺才能真正实现全面领先,而从i3 8121u的表现来看,很大概率上也意味着在第三代10nm++工艺实施之前,业界很可能都无法看到真正突破性的10nm处理器(一竿子支到三零零零年了……)。

预计将在今年下半年问世的ice lake处理器会使用第二代10nm+工艺,电气性能将非常接近14nm++工艺,或许那时intel在10nm工艺上打响真正的第一炮吧。