Intel与AMD的龟兔赛跑
英特尔与amd的竞争是乌龟与野兔的竞争。但哪家公司是龟?哪家公司是兔?
在过去的几个发布周期中,英特尔和amd的粉丝之间的评论之战一直很激烈,大量的数字墨水都在讨论这些年来哪个公司有了显著的改善,或者没有明显的改善。对于两家公司最快处理器的原始性能,也不乏意见。
我们认为,深入研究每个公司的最快桌面/ cpu的存档性能基准测试是很有趣的,这样可以很好地了解这些年来每个公司的实际表现,甚至可以看看是否有一些模式需要收集,或者对未来进行一些押注。
在深入研究图表之前,让我们先从一些表开始——通过这种方式,您可以看到我们使用了哪些cpu作为每年的里程碑。在我们研究的过程中,数据中有一些不规则现象;我们也会讨论这些,讨论一些简单图表无法展示的东西。
二十年来的发烧友计算
虽然英特尔和amd每年都会针对不同的价位和目标市场推出大量的处理器,但我们每年都局限于速度最快的台式机或“发烧友”处理器。这意味着没有服务器处理器,也没有高端台式机(hedt)处理器——所以我们不会关注threadrippers或最新型号xe系列英特尔部件。
即使是像我这样整个时期都是作为一个系统构建者的人,组装这样的列表也是一个巨大的痛苦,更不用说匹配测试结果了。这在amd方面尤其困难,因为amd并没有真正相当于英特尔的ark提供单一的处理器列表,按代、类型和发布日期排序。如果你认为我选错了一年中的“*处理器”,请在评论中告诉我。
我们应该解决图表中出现的一些异常情况——首先,不,2014年、2015年和2016年amd没有推出新的高性能cpu并不是疏忽。2013年的fx -9590被广泛(并且是理所应当)批评了它惊人的225w tdp和平庸的性能——在四年的运行中是team red最快的cpu。在此期间,amd推出了几代低功耗、价格低廉的桌面设备,但没有一款性能优于fx-9590。
英特尔在2013年至2017年期间也经历了几次失误,尽管没有那么严重或持续这么长时间。第五代core系列基本上死于2014年,尽管第四代core i7系列的更新确实提供了显著的性能提升。两年后,从技术上讲又是另一种风潮-配备core i7-7700k的kaby lake直到2017年1月才真正启动。我们稍加捏造,让kaby lake进入2016年的行列,因为否则它会完全消失,同年晚些时候coffee lake和i7-8700k出现。
amd athlon的兴衰:2001-2007年
现在很难相信,但曾几何时,多线程工作负载远比单线程负载要punish的多。但这并不是很久以前。
在2001-2005年,athlon xp和athlon 64 vs pentium 4-amd的时代在双线程工作负载上独占鳌头。2006年,英特尔的penti um965改变了这一平衡。
即使在athlon时代,amd也难以在单线程性能上赶上英特尔。它的athlon 64 x2处理器一度占据领先地位,但英特尔(intel)凭借酷睿2 extreme qx9650夺回了领先地位。
这是我们许多人在21世纪初忘记的事情-多任务处理性能 太差了。在上面的第一个图表中,我们正在研究多线程和单线程passmark cpu基准测试分数之间的比率。对于2001-2005年份的cpu,单线程得分实际上 高于多线程,这意味着您可以在给定的时间内在单线程上完成更多的计算工作,而不是分解为并行线程。
您可能会认为这是因为它们仍然是单核、单线程的cpu,但是您错了。intel在2002年引入了1c/2t pentium 4 2.8ghz的超线程,这对实际的多线程能力影响很小。amd在2005年推出了第一个真正的双核桌面cpu——athlon 64 x2 4800+,但它也没有太大的区别。
在英特尔2006年的pentium extreme 965(双核/四线程cpu)之前,多线程的比率没有突破100%——这意味着多线程任务比同等的单线程任务完成得更快。第二年,amd和英特尔都推出了真正的四核桌面cpu,并永久地结束了高性能单线程处理器的时代。
即使在amd的这个黄金时代,英特尔在单线程性能方面也击败了amd。pentium 4架构作为pentium iii的较弱后继者而受到全面和应有的嘲讽,而pentiumiii往往会逐时胜过它。但是,pentium iii的时钟频率不能达到pentium 4的水平,而且,无论如何,该时代性能最高的工作负载都是单线程的,并且英特尔的pentium 4在性能上领先于amd的athlon。尽管后者的cpu性能很弱。
对英特尔来说不幸的是,早在2001年之前,整个世界就已经转向了多任务操作系统,多线程的工作负载也随之出现,这在firefox前身phoenix在2002年采用选项卡式浏览中得到了证明。随着cpu饱和,用户逐渐习惯于全天打开许多程序的环境,多线程性能(而不是单线程)成为当务之急。
2007年,amd和英特尔都推出了真正的四核桌面cpu。两家厂商的发烧级cpu的多线程性能都达到了顶峰——尽管双方都获得了巨大的收益,但英特尔的core 2 extreme qx9650击败了amd的新phenom x4。
新的四核cpu具有足够的多任务性能,可以同时处理低优先级的后台任务和高优先级的前台任务,而不会使前台任务明显受损,这就将焦点转移到了单线程性能上。这对amd来说尤其不幸,因为intel不仅在多线程性能上有所改进,qx9650在单线程性能上也取得了突破。
随着近70%的单线程性能优势被英特尔的qx9650所取代,以及焦点突然回到单线程性能的王者地位,至少在这些高端cpu中是这样——amd 21世纪的第一个黄金时代正式结束了。
英特尔反击:2007-2013
与2008年的i7-965 extreme相比,英特尔2009年的i7-975 extreme并没有太大的改进,但2010年的十六进制core i7-980x则是一个大熔炉。与此同时,amd虽然年复一年地稳步前进,但仍然处于劣势。
在整个2007年至2013年期间,英特尔都比amd拥有单线程优势,而且通常是相当多的优势。
就提高cpu性能和功能而言,2007-2013年是一个令人振奋的时代,但就英特尔与amd之间的斗争而言,这是一个相当无聊的时代。英特尔从单线程和多线程性能的健康领先开始,一直保持领先地位。
在整个phenom和phenom ii架构的运行过程中,amd在多线程和单线程性能方面均取得了稳步的增长。这样一来,它在单线程性能上几乎可以赶上英特尔,但在多线程方面,它从未接近过。
两家公司都于2010年发布了他们的第一个六核cpu,但是amd的x6 1100t与2009年的x4 965使用相同的k10架构,英特尔的i7-980x既实现了芯片缩减,又添加了一套新的aes指令。这使intel的多线程性能几乎飙升了两倍,同时仍然保持了很小的单线程引导时间。
2011年,amd凭借其命运多舛的八核bulldozer架构全力投入多线程。尽管bulldozer确实在多线程领域开始在intel上取得重要地位,但这是有代价的。新的fx-8150实际上在单线程性能上倒退了。
到2012年,amd的bulldozer已成为piledriver,并且在多线程方面几乎赶上了intel,但这仅仅是因为intel在将其工艺缩减至22nm时将其核心数量从6个减少到4个。这使amd拥有“几乎一样好”的多线程性能,内核数量是原来的两倍,而单线程性能则比英特尔落后了三年。
2013年,情况更糟的是,amd推出了最终的piledrivercpu(可恶的fx-9590)。尽管英特尔在工程技术上的领先优势不断提高,但该cpu仍代表了一种保持竞争力的hail mary方法-它主要与英特尔i7-4770k保持同步,但仅通过时钟频率和电压来实现,而时钟频率和电压通常会留在“极限超频器”领域。
与fx-8350的125w和i7-4770k的84w相比,额定tdp为225w,fx-9590是几乎无法使用的cpu。在典型情况下,对其进行空气冷却是没有挑战性的,而且风扇的噪音和废热也令人讨厌,即使是铁杆amd风扇也无法为其找借口,尤其是在其竞争仍然轻松胜过它的时候。
fx-9590是amd四年来最后一个发烧级cpu。从2014-2017年开始,red team唯一的新cpu版本是预算cpu和apu,没有一个比fx-9590更好,更不用说竞争了。
命运的变化:2013-2020
事实上,amd在三年的低迷期中幸存下来,却没有发布一款新的cpu,这说明了市场的一小部分——以及每个厂商的利润率——最大、最快的cpu才是真正的。在2014-2017年,red团队继续推出了新的桌面cpu——但所有的新设计都瞄准了“财政上更合理”的市场细分,集中在便宜的apu上。
尽管amd惨败,但英特尔却大为吃惊。值得称赞的是,blue team确实继续发布了新的性能cpu,并在这段时间内实现了单线程性能的增量提升,但单线程的提升并不多。在2016年,很难从5年的旧cpu上进行升级。
2017年,一切都发生了改变,amd最终发布了一款代号为zen的全新、热情友好的架构。zen架构将功率和热效率恢复了一致,同时使原始多线程性能显著高于英特尔的最佳性能。尽管zen的单线程性能仍落后于英特尔,但它也实现了几次大幅跃升,夺回了这一桂冠。
2018年的zen +在多线程性能方面充其量仅是次要的改进,但与最初的zen相比,它在intel的单线程领先优势中所占的份额不大。英特尔的第一个可行的i9产品i9-9900k短暂地使red team夺回了多线程性能的桂冠,但领先优势并没有持续很长时间。
2019年,英特尔在*者这一领域大做文章——它最好的cpu是i9-9900ks,与2018年的i9-9900k相比几乎没有任何改进。与此同时,amd的ryzen 9 3950x又实现了一次巨大的多线程飞跃和一次强大的单线程增长。ryzen 9 3950x是一款16核/32线程的巨形处理器,展示了其新zen 2架构的最佳性能。amd还没有完全赶上英特尔的单线程领先地位,但它将i9-9900ks的多线程性能提高了一倍多。
这使我们到了今年。英特尔仍在为延迟10纳米制程工艺而苦苦挣扎,于是发布了i9-10900k,尽管它仍在与9900k和9900ks相同的体系结构上运行,但在单线程和多线程工作负载方面均取得了显着改善。不幸的是,对于blue team而言,amd并没有休息-2020年的zen 3架构大大改善了zen 2的单线程性能。
在这一点上,amd在单线程性能上处于领先地位。此外,连续第二年,它在多线程性能上遥遥领先,几乎是英特尔所能提供的最好性能的两倍。
长远来看:2001-2020年的一代一代的改进
看到英特尔在2012年出现反常现象吗?该公司从六核cpu降为四核-而且没有人在意,因为单线程性能得到了相应的提高。
amd最大的单线程spike对应的介绍,athlon 64 x2架构在2005年。2007年,英特尔推出了其核心系列产品。
乍一看,此图表与纯多线程之间没有太大区别,但请注意,amd的趋势线在2016年至2020年之间将保持一致。
如果我们想看看英特尔和amd的工程流程如何进行,那么从原始数据继续进行,并观察性能的代际提升是有启发性的-这意味着,今年的情况要比去年好百分之几。
这些图表放大了两家公司各自的架构变更和工程工作的影响,从而更容易发现重大变更。到目前为止,多线程性能是最大和最令人兴奋的峰值-随着2007年四核cpu的推出,多线程性能也达到了最高性能。在单线程图表上,几乎看不到任何东西。
我们最喜欢的一代图表版本是第三代,它将单线程和多线程改进平均到一条直线上,并赋予两者相同的权重。尽管乍一看它看上去与纯多线程图表大致相似,但还是会弹出一些有趣的功能。
第一个跳出这里的是英特尔在2005年的辉煌表现,在图表上只有不到100%的点。低于100%的跌幅可能很小,足以使误差造成波动-但是,即使pentium 3.8ghz并不比2004年的pentium 4 3.6ghz主动 恶化,但显然没有任何改善。
再看看amd从zen到zen +,zen 2和zen 3的2017-2020年进展,这很有趣。尽管此处的总体形状与我们在纯多线程图表上看到的相同发音m相同,但包含单线程性能清楚地表明,每个步骤都是超越最后一步的重要且持续的改进。
2021年及以后
对于台式机上的英特尔来说,现在形势严峻,而amd的另一项重大架构改进(zen 4)则在2021年面世,amd称其为“按部就班”,其工艺节点缩小至5纳米。
在英特尔方面,我们预计并不会像从i9-9900k到i9-9900ks那样糟糕。但是,这并不意味着blue team充满了光明。尽管i9-10900k确实比前几代产品有了显着且令人惊讶的改进,但它与amd的兴起没有匹敌-它仍然代表着垂死的架构的最后一口气。
英特尔的台式机cpu仍停留在14纳米制程上,明年的rocket lake也将保持14纳米制程。赛普拉斯cove架构本质上是英特尔10纳米sunny cove笔记本电脑架构的一种变体,被反向移植到较早的14纳米制程。
尽管英特尔通过其最新的sunny cove笔记本电脑处理器(今年至今仅在原型设计中看到了今年的tiger lake)获得了显着的性能提升,但其内核和线程数却很少,而高性能似乎与更高的功耗相关。
现在说10nm sunny cove在内核数和功率效率方面的限制是否会转变为14nm cypress cove还为时过早。但是,似乎不太可能在2021年看到英特尔像zen和它的继任者那样带动并很大程度上维持amd的复兴。
尽管如此,英特尔的坏消息很可能是性能爱好者的好消息。英特尔这个规模小得多的竞争对手,将需要不止一两个主导周期来巩固与大型oem和系统制造商的关系和市场认知。这些业务关系——以及由此带来的订单、收入和利润——将是保持amd强大的研发力量的必要条件,以确保未来amd能够为消费者提供更高的性能和更好的价格。
- the end -
原文链接:半导体行业观察 责任编辑:万南