到底有多大性能差距呢?历代Core i7处理器性能大比拼
十年前,当intel处理器从奔腾d升级到core 2 duo,业界是用“雷霆一击”来形容,那是一种飞跃式的质的变化,功耗温度大降而性能大涨,随后的core 2 quad虽然是个胶水四核,不过多了两个核还是带来了相当大的性能提升,接下来的nehalem架构实现了原生四核,内存控制器整合到cpu内部使得内存带宽大幅攀升,超线程技术的回归让cpu的多线程性能有了很大提升,后面的sandy bridge架构是对nehalem的一次大改,cpu与gpu真正的融合在一起,性能有了全面的提升。
但是后面几代cpu的性能提升就相当小了,每一代都是几个百分点的性能升幅,这也让intel这几年被玩家笑称为牙膏厂的原因。
在2006年intel提出了tick-tock战略,其中的tick一环是指cpu工艺升级,tock则是cpu架构升级,二者轮流交替,两年为一个周期,在haswell架构之前intel一直都是按照这个步伐一步步走过来的,2007年45nm工艺的penryn处理器,2008年是同为45nm工艺的nehalem架构,之后分别是32nm westmere、32nm sandy bridge、22nm ivy bridge、22nm haswell,22nm工艺是一个相当重要的节点,这是intel首次投入实用的3d晶体管工艺,然而随后的14nm工艺intel栽了个大跟斗,14nm工艺的延期迫使intel放慢了前进的步伐。
实际上intel现在的工艺技术路线已经变成了制程-架构-优化(process-architecture-optimization),算是从之前的两步走改成三步走了,步调放缓了。
都在说intel这几年来cpu的性能提升幅度不大,旧u还能继续战n年,那么最近几代intel处理器到底有多大性能差距呢?今天我们要测试一下从第一代的core i7-870开始到现在最新的core i7-7700k共六款六代的酷睿处理器,看看各代之间到底有多大的差距。不过在测试之前我们先来回顾下这几年来intel的各代cpu架构。
一切的开端:nehalem
08年推出的nehalem微架构是一切的基础,intel这几年的酷睿处理器微架构都是以它为基础,严格来说,nehalem微架构仍是基于上一代core微架构改进而来的,但它的改进是全方位的,计算内核的设计来源于之前的core微架构,并对其进行了优化和加强,主要为重拾超线程技术、支持内核加速模式turbo boost和支持sse4.2等方面,非计算内核的设计改动主要的有三级包含式cache设计、使用qpi总线和整合内存控制器等重要改进。
nehalem微架构采用可扩展的架构,主要是每个处理器单元均采用了building block模组化设计,组件包括有:核心数量、smt功能、l3缓存容量、qpi连接数量、imc数量、内存类型、内存通道数量、整合gpu、 能耗和时钟频率等,这些组件均可*组合,以满足多种性能需求,比如可以组合成双核心、四核心甚至八核心的处理器,而且组合多个qpi连接更可以满足多路服务器的需求。
正因为这样的模组化设计,英特尔可以灵活的制造出各种差异化的核心,比如支持三通道ddr3的bloomfield核心、支持双通道ddr3的lynnfield和clarkdale核心,而且这些核心间还存在是否支持超线程、turbo boost技术等区别,clarkdale还整合了gpu图形单元。
在2009年9月,intel推出基于nehalem微架构的lynnfield处理器,采用lga 1156接口,它与bloomfield的区别不单只在于内存通道数的差别,lynnfield把pci-e控制器整合到了cpu内部,而北桥其他功能与南桥一起整合到pch里面,主板从三芯片变成了双芯片,形成了现在主板的基本布局。
2010年的clarkdale只有双核设计,它把gpu也整合到cpu内部了,但是只是简单的将gpu和cpu封装在一起,并没有真正达到“融合”,一颗cpu里其实有两颗“芯”,cpu的制造工艺升级到了32nm而gpu部分则依然是旧的45nm工艺,它们采用qpi总线相连,对外则采用dmi总线连接pch。
真正的双芯融合:sandy bridge
在2011年伊始,intel就把微架构升级到新一代的sandy bridge,它真正将gpu与cpu融合,从以前的双u各立山头到合二为一,是非常大的突破, 内核架构也较nehalem有了较大变化,这些变化包括:新的分支预测单元、新的uop缓存、新的物理寄存器文件、有效执行256位指令、放弃qpi总线改用环形总线、最末级缓存llc机制、新鲜的系统助理等。
avx指令集的加入是sandy bridge最为重要的改进,浮点性能得以激增,新一代的turbo boost 2.0技术增强了sandy bridge自动提速的弹性,除cpu外还可对gfx进行加速,并随着系统负载的不同协调二者的频率升降,表现得更加智能化。
新一代图形核心具备出色的图形与多媒体性能,由于改用了环形总线设计,三级缓存可由cpu各核心、gpu核心与系统助理system agent共享,可直接在l3内进行通信。gpu主要包含了指令流处理器、媒体处理器、多格式媒体解码器、执行单元、统一执行单元阵列、媒体取样器、纹理采样器以及指令缓冲等等,架构与上一代相比有了较大修改。
3d晶体管起航:ivy bridge
ivy bridge虽然说只是sandy bridge的工艺改良版,架构上没太大改变,不过对intel来说却是一款相当重要的产品,因为它是首次采用22nm 3d晶体管工艺,是今后intel半导体工艺的重要基础;另外cpu内部的pci-e控制器也升级到了pci-e 3.0标准,带宽提升了一倍,分配方式也更灵活;内核方面的改进说是提升了ipc每周期指令性能,sse以及avx指令也有所增强;整合gpu性能也有所提升,eu数从12个提升到16个,api支持也从dx10.1升级到了dx11。
更强图形性能与更为精确的功耗控制:haswell
haswell是intel在2013年推出的全新微架构,该架构给人最深刻的印象就是把原来主板上的vrm模块整合到了cpu内部,fivr调压模块的加入让主板的供电变得简单,并且可以对cpu内部的电压进行更为精确的控制,提高供电效率,实际上haswell与broadwell架构的产品是我见过电压最为稳定的intel处理器。
指令集方面,haswell增加了两个指令集,一个是针对多线程应用的tsx扩展指令,另一个是就是avx指令的进阶版avx2。还有一点就是从haswell架构开始intel的核显开始了模块化、可扩展的设计,就此走上了暴力堆砌核显规格的道路,*的核显拥有40个eu,还有大容量edram作为l4缓存,可同时提升cpu与gpu性能。
其实在haswell与skylake之间还有个broadwell,就是采用14nm工艺的haswell处理器,不过broadwell主要用在移动平台上,桌面级的broadwell就两颗,而且国内没有正式上市所以没啥存在感,这里就不再做介绍了。
ddr4的时代到来:skylake
skylake可以说是自sandy bridge以来intel最给力的一次升级了,cpu同时升级架构、工艺及核显,内存同时支持ddr3与ddr4,采用了更为先进的14nm工艺使得skylake在频率提升、性能增强的同时功耗有了明显降低,而fivr电压控制模块则被取消了,电压的控制也重新回到主板上。
skylake处理器在超频上的改进可能让人眼前一亮,因为此前intel对超频的限制颇多,全民超频的盛况早就不存在了,但skylake处理器上,intel虽然会继续限制倍频,但这次的bclk外频限制没这么严了,外频能轻易超到125mhz以上,外频的解放更有助于极限超频玩家挑战更高记录。
核显方面,skylake与broadwell其实挺相似的,每组subslice单元依旧是24个eu,但是整体规模变得越来越大了,skylake最多可以扩展到3组slice单元,也就是说最多会配备72个eu单元,因此skylake也多出gt4这个级别的核显。
小修小补提升能耗比:kaby lake
kaby lake只是skylake的优化版本,主要改善能耗比,然而这些在桌面版的处理器上表现并不明显,桌面版第七代处理器比较明显的区别只是频率高了。
kaby lake虽然都是使用14nm制程,不过intel说他们对工艺进行了改良,kaby lake处理器上使用的新工艺使用了更高的鳍片与更宽的栅极间距,更高的鳍片意味着需要更小的驱动电流,这可减少漏电概率,而更宽的栅极间距这货会降低晶体管密度,这需要更高的电压但是可以降低生产难度,另外更宽的间距允许每个晶体管的产生的热有更多地方扩散,这有助降低内核温度并提升频率,这也是为什么kaby lake频率都比skylake高但功耗则没什么变化的原因。
gpu方面kaby lake的核心与skylake一样都是gen 9,不过针对4k视频回放进行了改良,增加了h.265 main.10、vp9 8/10-bit格式的硬件解码与编码,可大幅降低4k视频播放时的功耗,这对台式机来说可能不算什么,不过对移动设备来说降低功耗等同增加续航时间,这个是相当重要的。
这几年来intel lga 115x平台较有代表性的core i7处理器规格一览
近年来lga 115x平台*主板芯片组规格一览
说真的主板芯片组的变化可能是给消费者更新换代的更大原因,如果说这些年来lga 115x平台cpu给人的感觉总体差别不大的话,主板更新换代的差别就是相当大了,pci-e总线从2.0变3.0,存储接口从sata 3gbps慢慢进化到sata 6gbps到现在最新的m.2/u.2接口,usb接口从2.0到3.0再到现在最新的3.1,这些都是能看得到且相当实在的变化,再加上主板厂商每次都会在主板上加新花样,可以说主板带来的变化更有让人更新换代的冲动。
测试平台与说明
这次测试的处理器包括从core i7-870到core i7-7700k的六代intel lga 115x平台的处理器,core i7-5775c是稀有品那个就算了,他们会搭配对应的主板,core i7-7700k/6700k会使用ddr4内存,而其他处理器则使用ddr3内存,显卡采用gtx 1070 fe版,系统使用windows 10 build 1607,显卡驱动是nvidia geforce 372.70。
测试项目包括cpu基础性能测试与游戏性能测试,cpu性能测试用的都是基础性能测试软件,而游戏测试包括3dmark fire strike基准测试与《文明:超越地球》、《gta 5》两个游戏,会分别对比cpu默认性能与4g同频下的性能差别,此外还有功耗与温度的测试,由于cpu超频后的电压会随不同cpu的体质而不同,所以只测试cpu默认频率下的功耗与温度。
上一篇: AMD Vega GPU真片实拍:HBM2显存恐怖
下一篇: 不同品牌主板的接口颜色是统一的吗?