欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

程序员文章站 2022-11-26 15:34:24
说到处理器,对于大众用户而言,关注最多的自然是距离最近的桌面、笔记本消费级产品,而作为厂商最新技术的最强代表,服务器、数据中心才是真正的杀场。3月16日,amd发布了第三代霄龙7003系列(代号mil...

说到处理器,对于大众用户而言,关注最多的自然是距离最近的桌面、笔记本消费级产品,而作为厂商最新技术的最强代表,服务器、数据中心才是真正的杀场。

3月16日,amd发布了第三代霄龙7003系列(代号milan),拥有7nm工艺、zen3架构、64核心128线程等傲人规格。近几年,amd在数据中心领域也是不断取得突破,市场份额已经从当初的0.7%,来到了7%之上。

但在这个庞大的市场上,intel依然是王者一般的存在。虽然单看产品性能参数可能有些不敌,但无论是多达13倍的市场份额领先,还是全面丰富的技术特性,抑或更广阔的生态应用系统,都不是一个数量级。

事实上,这么多年来,intel至强几乎已经等于服务器、数据中心的代名词,2013年至今累计云端部署超过10亿个核心,云服务商超过800家,发展了三代的可扩展至强累计出货也已超过5000万颗。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

现在,intel终于带来了第三代至强可扩展平台ice lake-sp,再次将自己的优势展现得淋漓尽致,尤其是丰富的产品矩阵。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
本次中国区发布会选在了首钢园三高炉,颇有赛博朋克气息,也是冬奥会场地,往昔与未来在这里交织

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
intel副总裁兼中国区总经理王锐发表主题演讲

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

新至强拥有全新的10nm制造工艺、最多40核心80线程、全新sunny cove cpu架构、20% ipc性能提升、46%平均性能提升、74% ai推理性能提升,堪称intel至强近年来最大的一次飞跃。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

但是,新至强不是单打独斗,周边围绕着intel gpu、xpu、fpga、内存、存储、连接、安全等等各条产品线和技术,从而构成一个软硬结合的完整解决方案。

此前已经陆续发布的傲腾持久内存pm200系列、傲腾ssd p5800x、闪存ssd d5-p5316/d7-p5510、20万兆以太网卡e810、agilex fpga等等,这些都是新至强的得力助手,互相结合大大拓展了整体平台的实力。

按照intel的说法:“我们没有把至强称作一个服务器产品,它是一个数据中心产品。”

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

需要指出的是,去年6月19日发布的cooper lake,也是属于第三代至强可扩展家族,区别在于cooper lake只用于四路、八路市场,而新的ice lake-sp则是针对单路、双路市场。

说起来,ice lake-sp可谓命运多舛,发布时间一再延迟,主要是和新上的10nm工艺有关,而且引入了全新架构(cooper lake还是14nm和老架构),导致同一家族的两个系列产品间隔了将近10个月。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

当然了,对于数据中心平台而言,正式发布并不是开始,事实上在发布之前,ice lake-sp已经出货了20多万颗,拥有了极为丰盛的产品、方案。

王锐也表示:“至强处理器的出货有保证,特别是数据中心。我们在全力提升产能,实际的提升比计划更高。”

另外在新的ceo帕特·基因格上任后,intel已经在大刀阔斧地变革自己,包括加速推进新架构新工艺新产品,强化制造和产能,开放代工和外包。

接下来,我们就从架构技术、性能、生态三个方面,深入了解一下ice lake-sp。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
intel市场营销集团副总裁兼中国区数据中心销售总经理陈葆立展示ice lake-sp

一、架构技术:全面翻新、延迟优秀

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

intel提出,新至强最值得关注的变化,主要有三个方面,一是目前唯一內建ai加速的x86数据中心处理器,二是高级先进的安全解决方案,三是可扩展性、灵活性、可定制性。

接下来的解读中,我们也会逐一涉及这三个方面。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

架构方面,新至强引入了sunny cove,也就是轻薄笔记本上ice lake-u 10代低功耗酷睿平台的同款(事实上二者处理器代号都是相通的),都是首次结缘10nm,当然这次针对数据中心应用做了调整优化。

至于为何二者发时间错开了一年半,笔记本端去年都已经进化到第二代10nm tiger lake,架构也已升级为willow cove,你应该懂的。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

简单来说,sunny cove架构改进了前端部分,容量更大,分支预测更精准,加宽加深了流水线,结构和执行资源上规模更大,同时增强了tlb、单线程执行、预取等环节,还针对数据中心重点优化了缓存、矢量吞吐等部分。

对比二代可扩展至强cascade lake,新至强的最大核心数从28个增加到40个。

对于为何选择40核心这个节点,陈葆立表示,这是根据整个产品迭代所做的一个比较好的平衡,无论是核心数,还是不同工作负载的加速指令、配套的产品,设计芯片需要做很多事情,尤其是把功能做好是最优先的,能够更好地满足客户需要,而不是纯粹选一个核心数。

当然,不同的设计策略也决定了核心数量。amd霄龙是多个小芯片组成,虽然每个小芯片最多也才8个核心,但可以通过“并联”轻松堆砌更多核心。

intel则依然坚持单芯片设计,再加上制造工艺、内部架构,天然决定了不容易扩展太多核心,不过intel也在不断推进各种先进封装技术,未来的芯片规模有望实现突飞猛进。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

每核心缓存一级从32kb增大一半来到48kb,二级从1mb增大四分之一来到1.25mb,三级而从1.375mb小幅增大1.5mb,并支持hemisphere高性能交错模式。

内存支持从六通道ddr4-2933扩展到了八通道ddr4-3200,并改进内存调度器实现更低的延迟、更高的带宽,而且还有傲腾持久内存200系列这个杀手锏。

处理器间互连通道还是两条或三条upi总线,但是带宽从10.4gt/s扩大到11.2gt/s,同时首次原生支持pcie 4.0,通道数也从48条增加到64条。

独家的avx-512指令集这次增加了大量的新指令,涉及到加解密、压缩解压、安全等各个方面,可扩大应用范围、提升性能,这也是intel一贯的长项。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

intel还和新发布的amd三代霄龙做了正面对比,强调了自己在缓存延迟、内存延迟方面的优势。

缓存延迟方面,新至强的一二级其实比三代霄龙还稍微高一些,但三级就完全不一样了,毕竟一个是单die,一个是多芯片,不再同一个数量级,尤其是霄龙涉及到跨die通信、跨处理器的时候,延迟可以达到新至强的两倍甚至五倍。

内存方面,新至强的通道数、频率算是追平对手,但是延迟低得多,而且有独家的傲腾持久内存加持,单颗处理器支持最多4tb ddr4内存,或者4tb ddr4+2tb傲腾内存。

三代霄龙最多支持3tb ddr4,其实也可以搭配傲腾内存,但最大容量仅为1.5tb,而且关乎运行模式、平台联动、指令和应用优化,估计几乎不会有客户会去这么搭配,amd也坦承一切取决于客户自己的部署。——有点像thunderbolt雷电技术。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

指令集这个东西,一直都是intel占据领导地位,这次也新增了大量新指令,包括大数算数(avx-512整数ifma)、矢量aes、caryy-less乘法指令、伽罗华域新指令、sha-ni、vbmi等等,就不展开讲了,大家只要看看后边的性能提升就明白它们的威力了。

很多时候,一条指令的加入,很容易就可以在特定负载中带来数倍乃至数十倍的性能提升,远不是单纯改进硬件就能媲美的。

intel技术专家表示:“工作负载加速器指令就好比性能倍增器,它提供的增益要比仅向处理器添加核心所能带来的增益高很多。”

intel副总裁兼至强处理器与存储事业部总经理lisa spelman也强调说:“几年前开始我们就开始早早投资指令集和软件,这个战略正在产生巨大的回报。”

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

安全也是数据中心必不可少的关键一环,新至强的一大重点就是支持sgx软件防护扩展技术,它面世已经好几年,这是第一次登陆至强可扩展平台,用于双路系统。

它具备持续增强的安全能力,并通过了数百次的调研和生产部署,可大大缩小系统内的攻击层面,抵御各种攻击途径,保护敏感代码和数据,而且指定位址空间可隔离并处理最多达1tb的代码与数据,满足主流工作负载的需求。

尤为值得一提的是,sgx安全技术是独立于操作系统、硬件配置的,不受软硬件变动的影响和约束,部署更方便,效果也更明显,即便是操作系统、bios、驱动、虚拟机都被攻击了,它依然能保护数据。

再结合全内存机密技术、平台固件弹性技术,新至强可以真正解决敏感的数据保护问题。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

说了半天,大家可能会问,这次到底发布了什么产品?真的是相当相当丰盛。

如上图,最左侧一列是此前发布的四路、八路cooper lake,中间和右侧是新发布的单路、双路ice lake-sp,按照产品线分为铂金、金牌、银牌三个序列(没有了最低端的铜牌)。

按照应用方向,则分别注重单核性能、扩展性能、sgx安全性能、网络优化、云优化、媒体处理优化、长寿命、单路型、液冷散热等等,划分得非常细致,当然不同类型有所交错,有的型号可适用于多个方面。

intel还为不同版本加上了不同的字母后缀,包括v(saas云)、p(iaas云)、s(512gb sgx)、q(液冷散热)、y(sst-pp 2.0)、n(网络/网络虚拟优化)、m(媒体处理优化)、t(长寿命与扩展温度范围)、u(单路)等等,着实有点眼花缭乱。

*旗舰是至强铂金8380,40核心80线程,基准频率2.3ghz,全核加速3.0ghz、单核加速3.4ghz,二级缓存50mb,三级缓存60mb,热设计功耗270w,批发价8099美元。

相比之下,上代旗舰至强铂金8280 28核心56线程,频率2.7-4.0ghz,二级缓存28mb,三级缓存38.5mb,热设计功耗205w,批发价10009美元。

这代最强的28核心是至强金牌6348,频率2.6-3.5ghz,二级缓存35mb,三级缓存42mb,热设计功耗235w,价格3072美元。

两相对比,同样核心的时候,新一代频率低了不少,热设计功耗反而高了,这也是这代的普遍趋势,10nm对比炉火纯青的14nm还是差点劲,不过价格降到了只要三成!40核心也比上代28核心便宜了两成!

4/6核心型号取消,改为直接8核心起步,而基准频率最高3.6ghz的至强金牌6334,就是一款8核心,但这已经是极限了,最高加速此时也只有3.7ghz,而热设计功耗达到了165w,上代可是还有多款型号加速到了4.5ghz。

热设计功耗最低的也有105w,包括8核心的至强银牌4309y、10核心的至强银牌4310t,频率分别为2.8-3.6ghz、2.3-3.4ghz。

另外注意有个特殊的液冷散热型至强铂金8368q,38核心,频率2.6-3.7ghz,热设计功耗270w,可能是偏向oem定制。

其他型号就不一一解读了,感兴趣的可以自己慢慢对比。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心