AMD最牛处理器手撕Intel ThreadRipper 2990WX详细图文评测
在桌面cpu市场,过去几乎长达十年的时间,intel都处于无敌寂寞的状态,amd则属于打不死小强,一直则处于小众市场状态。2017年3月,amd锐龙登场,就像一剂强力催化剂,改变了一切,开启了逆袭intel之路。
凭借不世的zen架构,以及稳健的产品和市场策略,amd不断冲击各个领域。从桌面到移动笔记本,从企业到数据中心,从发烧到主流再到入门级,amd都博得了满堂彩,intel也终于惊醒过来,开始认真对待这个蛰伏许久的对手。
今年amd发布了第二代锐龙处理器,不仅12nm工艺制程领先intel,*第二代锐龙threadripper 2990wx“二代线程撕裂者”更是逆袭intel酷睿i9,成为目前最强的桌面处理器,今天我们就来通过amd锐龙threadripper 2990wx评测,带大家全面了解这款amd史上最牛cpu。
如果说锐龙让amd重新在主流和高端市场站稳了脚跟,threadripper处理器则把amd重新带到了发烧领域,这里是最新最强、最尖端技术的领地,没有两把刷子是进不来的。
amd一度错失发烧领域n多年,intel因此显得惰性十足,至尊平台虽然也在一代又一代地更新,但更多的是按部就班的小幅升级,无论工艺架构还是规格性能都波澜不惊,价格更是无比傲娇。
比如说在一年半之前,发烧友们能买到的最强的处理器还是酷睿i7-6950x,只有10个核心20个线程,价格却高达1723美元(国内一万三左右),而且从未降价。
2017年8月,也就是整整一年前,threadripper处理器诞生,谁都不会想到它居然轻松挑落了intel的霸主地位(而且它还是个计划外的产物呢)。
第一代旗舰threadripper 1950x,上来就有16个核心32个线程,再加上四通道ddr4内存、64条pci-e 3.0等激进规格,表现绝对是吓人级别的,比如多线程性能比i7-6950x一下子就提高了一半。
更关键的是价格,它定在了999美元(国内首发8499元现在已经只要5999元),只有i7-6950x的一半多点,从性价比上讲更是高出2.5倍,因此极具杀伤力。
intel当然不甘心被压一头,随即拿出18核心36线程反击,并首次寄出了雪藏多年的酷睿i9序列,性能上保住了自己的王者地位。
但是这颗i9-7980xe的价格高达1999美元(国内首发15999元如今仍要14999元),显得高不可攀。
amd这种激进的产品和定价策略十分有效,也获得了普遍认可。从京东商城的评论看,1950x、7980xe的销量比大概是十比一,对于amd来说这无疑是一个十分漂亮的战绩。
一度有传闻称,intel打算放弃至尊发烧平台。虽然被intel否认,但也不难看出,intel如今在*领域内确实有点扛不住。
第一代锐龙threadripper处理器已经打了所有人一个措手不及,第二代又让所有人震惊了一把,恐怕谁都没想到amd如此激进,几乎就是直接把数据中心的epyc霄龙给完全搬了过来,桌面平台首次出现了堪称恐怖的32核心64线程。
每次打开windows系统的任务管理器,看到64个框框,那种震撼,真的妙不可言哪。
amd突然来这么一招,不仅仅让intel现在的18核心36线程无地自容,也几乎断绝了intel的后路,因为在目前架构下,intel最多也就28核心56线程,无论如何是追不上了。
当然,intel可以搞单芯片封装两个die,组成56核心112线程,但无论功耗发热还是价格,必然都会失控。
根据泄露的路线图,intel确实打算在桌面上祭出28核心56线程,并为此开辟新的a系列,有望在今年底推出,但接口又要变,主板又要换,amd这边则是一个tr4包打天下(主流也就一个am4)。
但最关键的还是价格,amd直接把32核心64线程压到了1799美元(国内13999元),实在是狠得没法形容,这比18核心36线程的i9-7980xe还要便宜一大截。
28核心56线程,intel怎么也不会卖得低于两万五,基本等于两颗amd 32核心56线程……
二、技术解析:各种玩法享受32核心
1、架构与工艺
第二代amd锐龙threadripper处理器和主流市场上的第二代锐龙一样,都应用了升级后的zen+架构,以及升级后的globalfoundries 12nm(12lp)制造工艺。
在此前对锐龙7 2700x、锐龙5 2600x的首发评测中,我们已经对zen+架构和gf 12nm做了较为详细的介绍,此处不再赘述。
简单地说,zen+架构的ipc性能提升了大约3%(可以理解为同频性能提升3%),一二三级缓存分别降低最多13%、34%、16%,内存延迟降低最多11%,内存频率提高到2933mhz。
按照amd的数据,2990x的一二三级缓存延迟分别为1ns、2.9ns、9.03ns,2950x分别为0.92ns、2.76ns、8.64ns。二者内存延迟为近端64ns、混合86ns、远端105ns。
gf 12nm则是此前14nm的优化版,晶体管性能提升10-15%,对于第二代threadripper来说最高加速频率提升200mhz,任何频率下核心电压降低80-120mv。
2、更强动态加速
升级后的sensemi智能技术也得到完整继承,比如第二代精准频率提升(pricision boost 2),加速幅度精细到25mhz,更关键的是升级了算法,会在撞到散热或者供电限制之前加速到尽可能高的频率,或者达成预设频率。
直白地说,在多核心多线程运行的时候,第二代threadripper仍能保持尽可能高的频率,而且线程数量增加与频率降低基本呈线性关系,而不会像之前那样突然遭遇断崖式降频。
根据amd提供的数据,2950x可以在单线程时加速到最高4.35ghz,之后随着线程增多,频率稳步下降,16线程时仍能保持在3.7ghz的高度,32线程跑满时也能有3.5-3.6ghz。
2990wx身上同样体现的十分明显,单双线程时能接近4.2ghz,32线程时可泡3.6ghz,即便是64线程全开也能稳定在3.4ghz。
其实很多时候,我们经常可以看到某款处理器标称的加速频率很高,但很难坚持很长时间,往往几十秒甚至几秒钟就会掉下来(所谓三秒真男人),而且随着线程数量的增多,加速也会十分困难。
而第二代threadripper处理器在核心线程数量大增的同时,依然保持了强劲的多线程加速能力,不至于在多线程负载中频率跟不上而造成实际性能低下,这无疑是难能可贵的。
还有第二代自适应动态扩频技术(xfr2)。如果散热器更强大,或者运行温度更低,第二代threadripper处理器同样可以获得额外的加速空间,而且和第二代精准频率提升一样,它也是在所有核心与线程上工作的。
根据amd提供的数据,如果把2990wx在180w普通风冷散热器、32℃室温下的性能视为基准,换用新的wraith ripper散热器可以额外加速多达11%,室温降至20℃则可以提升13%,而如果换上水冷,则能平白获得16%的额外性能!
至于精准功耗控制、神经网络预测、智能数据预取三项技术,都没有任何变化。
4、游戏模式
2990wx是全球第一颗32核心64线程桌面处理器,其实并不适合打游戏,因为没有任何游戏需要这么多核心,而且游戏引擎开发之初一般也不会考虑如此之多的核心,所以用它跑游戏反而往往会出现兼容性和性能问题。
为此,amd特别提供了游戏模式(game mode),可以在ryzen master工具中与创作者模式(creator mode)互相切换,打开后2990wx就会只使用8个或者16个核心,此时游戏性能反而会更高。
以上是amd官方提供的2990wx正常模式、游戏模式的游戏性能对比,可以明显看到在多少游戏中,游戏模式都很有用,尤其是《gta 5》、《杀出重围:人类分裂》、《全面战争:战锤2》、《占地1》。
amd也表示,游戏对于多核心的支持也正在完善,去年16核心threadripper处理器刚出来的时候,不少游戏都不正常,但现在已经几乎不存在这种问题,从上图也可以看出,16核心跑游戏偶有性能下降,但影响并不大。
后边的环节里我们会对游戏模式的具体原理、效果进行详细测试、分析。
5、内存模式
由于锐龙threadripper处理器核心众多,而且内部分成多个die,又支持四通道内存,所以在内存支持和应用方面amd也做了特别设计,使用的时候需要分情况注意。
为了理解第二代threadripper处理器的内存机制,先来看看结构拓扑图:
2950x还相对简单一些,内部两个die,每个die有8个物理核心,同时每个die对外连接两个内存通道、32条pci-e 3.0通道(分成两组),两个die之间通过一条inifinity fabric总线互连,ddr4-1600内存的时候io带宽就有大约50gb/s。
2990wx就比较复杂了,内部共有四个die,各自还是8个物理核心,但依然只有两个die分别负责对外连接两个内存通道、32条pci-e 3.0通道,另外两个die是没有的,amd称之为compute die,也就是只负责计算。
同时,每两个die之间都有一条infinity fabric,总计六条之多,这样可以保证两个die之间的物理核心可以直接沟通,从而降低延迟。内存频率1600mhz的时候,每条互连总线带宽约为25gb/s,也就是2950x的一半。
为了提高内存性能,amd设计了两种内存访问模式,其一称为分布模式(distributed mode),整个系统配置为一体化内存访问(uma),内存访问需求在所有可用通道之间均匀分配,即便是应用在多线程下的表现难以预料也能确保内存性能的一致性。
这也是线程threadripper平台的默认内存模式,也是ryzen master工具中创作者模式(creator mode)搭配的内存模式。
其二是本地模式(local mode),配置为非一体化内存访问(numa),它是2950x的独有模式,整个处理器分为两个节点(node),每个节点包含一个die和两个内存通道。
操作系统会尽可能将进程和内存需求放在同一个节点内,不够了才会扩展到第二个节点,这能在线程不多时降低内存延迟,非常适合用来玩游戏,因此在ryzen master工具中,如果启用游戏模式(game mode),2950x就会切换到本地模式内存配置。
自从锐龙发布以来,amd就在持续研究不同游戏对于处理器配置的敏感度,发现差异相当大,比如《古墓丽影崛起》、《守望先锋》、《奇点灰烬》等喜欢更多核心,《暗影魔多》、《地铁:最后微光》、《热血无赖》在高频率下表现更好,《战争机器终极版》、《辐射4》、《杀手:赦免》对内存延迟很敏感,《使命招魂:现代战争》、《孤岛惊魂4》、《星球大战:前线》则需要核心之间的低延迟。
amd表示,在16核心上评估了超过75款游戏后发现,本地模式能带来平均约5%的性能提升,《杀手:赦免》最高可超过10%,而非游戏应用在分布模式上表现更佳,证明两种内存模式的设置和切换是有效的。
6、传统兼容模式
ryzen master中还提供了一种传统兼容模式(legacy compatibility mode),打开之后2950x会只启用一个die、8核心16线程、双通道内存,2990x则可以是两个die、16核心32线程、四通道内存,也可以是一个die、8核心16线程、双通道内存。
如果有游戏对于多die、多核心多线程、多内存通道完全不兼容,这就轮到了传统兼容模式表现的时候了。
amd测试了60多款游戏开关传统兼容模式的性能对比,发现平均会带来4%的性能提升,最好的四分之一游戏更是可以提升12%,主要有《文明6》、《使命召唤:现代战争》、《风暴英雄》、《全面战争:战锤2》、《dota2》、《孤岛惊魂5》、《幽灵行动:荒野》、《看门狗1/2》、《神偷》、《杀手:赦免》、《辐射4》、《csgo》、《生化危机7》、《战锤40k:战争黎明3》。
7、pbo超频
amd处理器全线开放手动超频,可以轻松获得更高性能,现在第二代threadripper处理器又提供了一种新的超频模式“precision boost overdrive”(pbo)。
它也可以理解为一种自动加速超频技术,但更多地取决于主板设计,包括处理器插座功耗承受能力、主板热设计电流、主板电气设计电流,这三者尽可能地提高来获取更多性能,官方号称可比默认状态额外带来16%的提升。
官方号称可比默认状态额外带来16%的提升。
pbo相比于手动超频,最大的好处是会保留空闲降频、精准加速能力,而不是固定在一个频率上,从而更加灵活。
但是注意,pbo也属于超频行为,由此造成的损坏将失去质保。