欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

硬件工程师培训教程(八)

程序员文章站 2022-12-19 10:54:26
硬件工程师培训教程(八)二、AM D 公司的新款C P U 1 .D u r on 处理器 D u r on 的研发代号为S p i t f i r e(烈火),其中文名字叫钻龙。D u r on 一词源于拉丁语“durare ”,意思是“长久”,再加上... 09-04-21...

二、am d 公司的新款c p u

1 .d u r on 处理器

d u r on 的研发代号为s p i t f i r e(烈火),其中文名字叫钻龙。d u r on 一词源于拉丁语“durare ”,意思是“长久”,再加上后缀“-on ”,显然a md 选择 duron 作为处理器的名字是因为希望它能为用户的投资价值 延长寿命。当athlon 终于在高端c pu 领域把i n t el 重重打 了一拳后,2000 年4 月27 日,amd 宣布正式推出d u r on 作 为其新款廉价处理器的商标,并以此准备在低端市场向 i n t el 发起更大的冲击。

duron 处理器采用了thunderbird(雷鸟)处理器的核心, 0.18 μm 铝工艺制造,集成有全速的1 2 8 kb 一级缓存,采 用socket a 架构并支持200mhz 的前端总线频率,具有增强 了的3dnow!多媒体技术。duron 处理器的晶体管数目为2500万个,工作电压和电流分别为1 .6 5v 和2 5a 。总功耗为 4 1w,是c e l e r o n ⅱ 600mhz 处理器的两倍多,因此发 热量较大。正式上市的d u r on 起始主频为600mhz 。目前 已经发布了6 0 0 m hz 、6 5 0 m hz 、7 0 0 m hz 和8 0 0 m hz 等几种 型号,稍后还会有更高主频的型号上市。由于d u r on 全 部采用a m d t h u n d e r b i r d(雷鸟)处理器的核心,因此具 有全面优于k6 系列的卓越性能,能耗较之原来的k6 系列 大幅降低,三通道的浮点运算处理能力使一直让a md 倍 感头痛的浮点运算问题得以解决。

从技术角度分析,a m d d u r on 处理器与i n t elc e l e r o n ⅱ处理器有许多类似之处,但也有着极大的不同。相同的是,这两款低价位的处理器都针 对于需要廉价电脑的商业和家庭用户,而且技术应用也十分相似,都是采用0 .18 μm 的制造工艺, 将全速l2 cache 集成在die(cpu 内核)中。不同的是,duron 处理器的l2 cache 为64kb,而celeron ⅱ则为128kb 。duron 处理器采用的是thunderbird(雷鸟)处理器的核心,其l1 cache 为1 2 8 kb,外 频为100mhz,而celeron ⅱ采用的是coppermine 核心,而且其l1 cache 为3 2 kb,外频仅为66mhz 。

众所周知,cpu 的二级缓存和内存之间的数据传输率始终是系统运行的瓶颈所在。duron 内置的128kb一级缓存从数量上已经是celeron ⅱ的4 倍,这样在平时工作中就允许有足够多的数据存放在一级缓存中,一级缓存的命中率提高了,二级缓存的瓶颈就可以得到有效遏制。从这一点上分析,尽管duron 只有64kb 的全速二级缓存,但其性能表现已超过具备1 2 8 kb 全速二级缓存的c e l e r o n ⅱ。

由于d u r on 与c e l e r o n ⅱ一样也引入了0 .18 μm 的铝工艺技术制造,能耗降低的好处自然就是 超频性能的提升。

2 .t h u n d e r b i rd 处理器

新款的thunderbird(雷鸟)处理器和p ⅲ coppermine 处理器相比有以下几点区别:首先,在缓存 系统构架方面,thunderbird 处理器采用的是外置缓存构架,而i n t el 公司一贯采用的是内置缓存构 架。基于内置缓存系统的p ⅲ coppermine 处理器在正常工作时,其存储在l1 cache 中所有的数据都 被复制到l2 cache 中。

基于外置缓存的thunderbird 处理器则恰好与内置缓存运作相反,其在工作时不是将l1 cache 中 的数据复制到l2 cache 中,l2 cache 中只是包含了将要写回内存子系统的备份缓存模块。因此,a md 一直强调其thunderbird 处理器核心采用了384kb 片内缓存,因为如果thunderbird 处理器内建了128kb 的l1 cache 后再加上容量为l1 cache 一倍的高达256kb 的l2 cache,累计起来正好384kb 。

其次,虽然thunderbird 处理器仍采用64 位数据通道,但这种64 位的数据通道比p ⅲ coppermine 处理器所采用的256 位数据通道窄得多,而这相差3 /4 的二级缓存数据带宽势必会妨碍thunderbird 处 理器较之p ⅲ coppermine 有更佳的性能表现。第三,thunderbird 处理器和p ⅲ coppermine 处理器 的二级缓存还有一个不同之处在于,t h u n d e r b i rd 处理器内置了16 通道的二级缓存访问,而p ⅲ coppermine 处理器仅设置有8 通道二级缓存访问。显而易见,拥有16 通道相对l2 cache 的thunderbird处理器比只带有8 通道相对l2 cache 的p ⅲ coppermine 处理器有着更高的数据命中率。

3 .p a l o m i no 和m o r g a n(摩根马)

palomino 处理器是amd 对intel pentium 4 处理器的回应,而且很有意思的是发布的时候它居然 被叫做了athlon 4,此前并无athlon 2 或athlon 3 的说法。从设计规划上看它有能力威胁到intel pentium ⅲ处理器的市场份额。这款芯片拥有512kb 全速二级缓存;起始工作频率大约在1 .5 g hz 上 下;芯片组采用a m d 7 60 、a m d 7 6 0 mp 、v i a k x 2 66 和v i a k t 1 33 。

morgan 是用来替换amd duron 处理器的。这样的升级可以保证a md 在一个时候只制造一种处理器核心,而不是高端已经升级,低端却仍然保留在过去的水平上,从而降低成本。m o r g an 的关键技 术特征有:64kb 或128kb 全速二级缓存;起始时钟频率900mhz;芯片组:via km133 、kl-133 、sis 730s 。 这款处理器被期望在2001 年3 季度转而采用0.13 微米的技术加以制造。(amd 可能会和ibm 有某种 方式的合作,来提升生产力)。这种转换将有助于降低电力消耗和增加核心的时钟速度。

4 .t h o r o u g h b r ed 、a p p a l o o sa 和b a r t on

2 0 01 年年底之前,amd 将把其第七代处理器过渡到更小、更先进的0.13 微米制作工艺。第一块 0 .13 微米芯片将是p a l o m i no 继承者,代号“t h o r o u g h b r ed ”。目前,a md 还没有透露有关t h o r- o u g h b r ed 的更多信息。据我们所知,a md 预计在年底开始限量供货,到2 0 02 年上半年全线生产 thoroughbred 。既然amd 以前把2002 年初的奋斗目标定在2ghz,我们就有理由相信thoroughbred 将 是2ghz 的产品。而m o r g an 的继承者是“a p p a l o o sa ”,amd 计划以这种0.13 微米的处理器进军经济 型市场。amd 的规划显示,a p p a l o o sa 将比t h o r o u g h b r ed 稍微晚一点点发布。

a md 处理器未来的规划中还包括了一个新的面向高性能市场的速龙核心,代号“b a r t on ”。和 thoroughbred 一样,有关b a r t on 的信息amd 说得含糊不清,惟一知道的一点是它将运用从ibm 获得许可的soi(silicon-on-insulator)技术。barton 将在2 0 02 年下半年某个时候推出,届时,amd 还计划推出它的第一个64 位处理器“h a m m er ”。

5 .k8 

代码为“sledgehammer ”(大锤)的k8 处理器是amd 与intel pentium 4 竞争的下一代技术产品。从amd 已经公布的资料分析,k8 处理器将不再采用全新的64 位设计,而是重新回到x86-64 的轨道上来(即增强型的x 8 6 -3 2),以便与现有的32 位和16 位程序兼容。k8 就是这种设计下的第一款成品。

新一代的k8 芯片尺寸将会进一步缩小,达到1 1 0 mm 2 ,同时可以在一个内核中集成两个处理器并 使之并行工作。k8 处理器将不再采用e v6 总线结构,而是全新的ldt(lightning data transport, 闪电数据传输总线)。它能提供高达6 .4 g b /s 的数据传输率,并且兼容当今的外围设备和输入/输出 装置。a md 也在开发适用于此总线的api(application programming interfaces,应用程序接口)和插拔接口。第一颗k8 将使用与摩托罗拉共同开发的0 .18 微米铜线互连技术制造, 初始速度为1 g hz,2 0 01 年正式上市。a md 如果能成功开发出k8,势必会如愿以偿地 成为x 86 体系的领导者。

三、其他厂商的新款c p u

1 .v ia 的c y r i x ⅲ处理器 c y r ix 曾经是一家相当有实力的处理 器设计公司。早在486 时代,c y r ix 便红 极一时,甚至俨然已经可以和当时的 i n t el 分庭抗礼。c y r ix 所设计的5 x 6120mhz 处理器是一款比奔腾75 还要快的4 86 级处理器,推翻了下一代处理器总比上一代处理器要快 的结论,不仅创造了一个奇迹,也延长了4 86 处理器的生命。不过进入5 86 时代后c y r ix 公司便 开始下滑,连年亏损最终被v i a(威盛)收购。而586 时代的另一个c pu 厂商i dt 也因为经营困难而 被v ia 收购。c y r i x ⅲ便是威盛收购c y r ix 和i dt 之后开发的。 //本文来自www.jb51.net转载请注明

cyrix ⅲ原名joshua(约书亚),定位于低端 市场,锋芒直指i n t el 的c e l e r on 处理器。但 joshua 没有上市,后来via 将idt 的winchip4 重 新命名为c y r i x ⅲ,这就是s a m u el 。与前一款 产品不同的是,新款cyrix ⅲ的芯片面积大幅度 缩小,内核电压也降为1 .8v,一级缓存为 128kb,但没有二级缓存。由于cyrix ⅲ内置了 mmx 和3dnow!指令,因此在多媒体领域应该还是 具有一定实力的。早在处理器面市之前,via 便声称cyrix ⅲ将是抢夺celeron ⅱ处理器市场份额的利器。首先,cyrix ⅲ的外频可以支持66mhz 、 1 0 0 m hz 甚至133mhz,而且为了改变c y r i x ⅲ处理器天生浮点运算能力较差的弱点,新款c y r i x ⅲ提供了两个80 位的浮点处理单元。其次,c y r i x ⅲ与 celeron ⅱ处理器一样采用了socket 370 接口,可以兼 容c e l e r o n ⅱ处理器所使用的芯片组。第三,c y r i x ⅲ 处理器较之c e l e r o n ⅱ还有一点优势,那就是c y r i x ⅲ 可以同时支持intel 的mmx 和amd 的3dnow!多媒体指令集。 但一些权威媒体的测试表明,由于没有了二级缓存,新 款c y r i x ⅲ的性能大打折扣,综合性能赶不上同频的 c e l e r o n ⅱ。

2 .v i a c3 2 0 01 年5 月25 日,v ia 在cebit 2001 上发布新的c3

36处理器,采用标准的socket 370 接口,起始频率为7 3 3 m hz 。该处理器采用0.15 微米工艺制造,核 心面积只有5 2 mm 2 ,内部集成了1 2 8 kb 全速一级缓存,6 4 kb 二级缓存。支持1 3 3 m hz 前端总线频率、 3 d n ow!和mmx 多媒体指令集。

另外via 的整合型处理器m a t t h ew 的计划依旧,并没有受到intel timna 夭折的影响。这颗内建s a m u e l 2 核心、a p o l l o p r o 1 3 3a 、s3 savage4 、音效、网卡、m o d em,采用0 .18 微米制程的处 理器,是v ia 进军低价笔记本电脑的有力武器。

3 .c r u s oe

2 0 00 年1 月16 日,一家在业界很不出名的公司t r a n s m e ta 突然宣布了他们自行研发的处理器crusoe 。一石激起千层浪,惹得i n t el 、amd 两家自以为世上无人再有能力生产便携机cpu 的厂商大 跌眼镜。crusoe 是一款应用于笔记本电脑和internet 网络设备的新型处理器。crusoe 芯片的开发者transmeta 公司在芯片研发过程中采用了一种革命性的微处理器设计方案。与主流的x86 处理器完全使 用硬件设计不同,crusoe 处理器的解决方案采用软硬兼施办法,即硬件引擎核心和软件核心的合成结 构。

crusoe 处理器的硬件核心组成部分采用了高性能低功耗的vliw(very long instruction word, 超长指令)引擎,其核心指令与普通的x86 处理器指令没有相同之处。这种vliw 结构的处理器逻辑控 制芯片,采用非常简单的设计和软件的指令时序安排。它允许一个简单和非常直接的硬件执行流程, 包括7 条整数管道流水线和10 条浮点管道流水线,使得参与处理器逻辑控制的晶体管数量大为减少。

而crusoe 处理器的软件核心则是包围的软件层构造,以此使得crusoe 能与x 86 硬件结构的处理 器运行指令相同。这个具有全新定义的软件层又称之为“c o d e m o r p h i ng ”(代码融合)软件,它可 以动态“m o r p h i n g(融合)”x86 指令进入本地硬件引擎。在指令执行时,cruose 编译x86 指令块一 次,就将编译的结果保存到编译缓冲区中,下一次(已经编译)的代码执行时,系统跳过编译这一 步,以全速直接运行已编译过的指令。