引入45nm制程—中端处理器大变革
对于处理器厂商而言,拥有从高端、中端到低端的完整产品线布局是十分必要的,高端处理器可以帮助厂商树立并提升形象,而低端处理器则可以帮助厂商提升市场占有率,中端处理器对于厂商的重要性则更是不言而喻,市场上也往往都以厂商推出的中端处理器为主流产品。
多年来Intel一直在奉行制程更新与处理器架构体系改变的交叉更替,以确保在制程没有改变的情况下可以借由处理器体系架构的更新来提升产品性能,又或是处理器架构没有改变的情况下借由制程的更新来提升产品性能。就这样,我们经历了从Westwood核心到130nm再从90nm到Netbeast,然后是65nm到Conroe、kentsfield等一系列的变革。
暨Intel于2007年年底将45nm制程应用于高端的四核心QX9650和QX9770处理器之后,今年Intel则是打算进一步全面过渡到45nm工艺,此次Intel推出的酷睿2 E7000系列处理器,便是全面采用了45nm制程工艺,将成为Intel在中端处理器市场中的重点产品。本文将以E7000系列中的E7200处理器为例来对E7000系列做出解析,在此之前还是让我们一起先来回顾一下45nm制程工艺所带来的一些新的特性和优势。
45nm制程—40年晶体管技术最大突破
2007年年初,就在AMD于3月28号刚刚展示了其65纳米全新架构的Barcelona四核处理器技术细节之后,英特尔就于3月29号公开对外宣布:其原计划在2008年投入使用的45纳米工艺,以及采用45纳米工艺的Penryn处理器家族提前在2007年第四季度投入使用。那今年Intel毫无疑问的将会进一步普及45nm工艺,不过这次Intel的工艺转换还加入了一些新的元素。
所谓的制程工艺,就是指晶体管之间的线宽,如65nm制程就是指晶体管之间的线宽是65nm,但这次Intel 45nm制程的更新不仅是把晶体管间的线宽缩短到45nm,在构成处理器的细胞元件——晶体管上也有着非常重大的突破。
晶体管其实就是一种简单的开关装置,可处理电子数据中的0、1组合。处理器就是含有数百万此类通过铜线以特定方式连接在一起的晶体管。而晶体管内部是由源极、漏极、栅电极、栅介质、及硅底层通道。源极是指晶体管中电流产生的部分,它包含涂层硅(doped Si),漏极是指晶体管中电流流向的部分,这部分与源极一样,都参杂了一些杂质以降低电阻。不过晶体管是绝对对称的,则电流可以从源极流向漏极,也可以从漏极流向源极。栅极电极就是晶体管顶端的区域,其电流的状态决定晶体管是打开还是闭合,传统上栅的制作材料是多晶硅或原子随意排列且不形成网格状结构的硅。栅极介质是位于栅极电极以及沟槽之间一层薄层,目前的数字芯片中晶体管栅介质是由二氧化硅组成,而二氧化硅是绝缘体材料,它的作用是隔绝来自栅极电极的泄漏电流,但如果这个栅介质层太薄其泄漏电流的电量就越大。
Intel对晶体管的改进是来自之前晶体管的栅极介质,Intel是使用一种基于铪元素的化合物来替代之前的二氧化硅,这种基于铪元素的High-K介质具备良好的绝缘属性,同时可以在栅极及硅底层之间形成较高的场效应(High-K)。因为High-K的铪化合物比二氧化硅更厚的同时保持着理想的高场效特性,所以,这种High-K材料还可以大幅度减少泄露电流。据Intel官方发布的数据,这种High-K介质可以比之前的二氧化硅材料降低泄漏电流10以上。而同时因为场效的提高,使得晶体管源极到漏极的驱动电流提升20%,源极到漏极的泄露电流降低5倍以上。如果这些数据真的如Intel所公布的一样,那么对于单个晶体管来说我们就可以获得比之前更高的开关效率,以及更低的泄露电流。而对于拥有几亿个晶体管的现代处理器来说,我们可以从中获益是非常可观的,这显然更有利于提升intel处理器的每瓦性能(Performance per watt)。
虽然基于铪的这种High-K栅介质有着高场效以及绝缘的良好特性,但其却不能使用之前的多晶硅栅极,而是需要应用上一种全新的金属栅极来替代,目前Intel均没有透露这些材料的组成元素以及其具体配方,但在之前的新晶体管发表会时Intel代表却表示,竞争对手想要达到目前Intel 45nm产品晶体管的效能,至少需要到对手下一代的32nm工艺,对于Intel的这种说法我们是持有待考察的态度,毕竟实际的效能表现需要等双方的产品具体发布出来才有正确的答案。
45nm制程—带来更多的架构改进
Radix-16除法器以及增强型英特尔虚拟化技术:
Radix-16除法器以及增强型英特尔虚拟化技术是Penryn基于酷睿微体系架构中宽位动态执行的改进,新增加的Radix-16相除技术与前代产品相比能将所有应用上的计算除法器速度提高约一倍。而增强型英特尔虚拟化技术则可将虚拟机的转换速度提高25-75%。上面的这些特性仅是通过Penryn架构则可实现,无须在软件应用层修改现有的程序。
Smart Cache将增加到6MB、12MB:
在之前的Conroe微体系架构中新引入了Smart Cache共享缓存技术,在65纳米工艺下的Conroe双核心产品的L2 Smart Cache最大容量为4MB,四核心产品L2 Smart Cache最大容量为8MB。但借助于45纳米工艺下晶体管尺寸的减少,Penryn家族的双核心L2 Smart Cache最大容量为6MB,四核心产品L2 Smart Cache最大容量为12MB。在缓存容量提升的同时,Penryn处理器还具备更高的关联度,能进一步提升命中率及利用率,从而显着的提高计算性能及响应速度。
SSE4指令集以及Shuffle引擎:
Penryn中包含了英特尔SSE4指令集,这是自最初SSE指令集架构ISA推出以来添加的最大指令集,其中包含了47条多媒体处理指令,进一步扩展了英特尔64指令集架构。超级Shuffle引擎是基于酷睿微体系架构高级数字媒体增强下的新特性,通过实施全宽、单通道、128位的Shuffle单元,Penryn处理器能够在单个周期内执行全宽shuffle。这可以大幅提升SSE2、SSE3和SSE4等具有类似shuffle操作的指令性能。
深层关机技术与增强型动态加速技术:
深层关机技术与增强型动态加速技术是增对之前酷睿微体系架构中智能功效管理而改进的新特性,深层关机技术是应用在移动式Penryn产品中的一种全新高级电源管理状态,该状态可以显着处理器idle状态下的功耗,从而消除内部晶体管漏电流的影响,延长了笔记本电脑电池的使用时间。增强型动态加速技术同样是针对移动式笔记本应用的改良型技术,该技术的特点是:当处理器其中一个内核处于idle状态时,该特性可以利用该内核释放的性能扩展空间来提升另一个处于激活状态下的内核性能。
整体来说Penryn处理器家族产品还是在沿用之前的酷睿微体系架构,对于酷睿微体系架构的五大特性——宽位动态执行、高级智能高速缓存、智能内存访问、高级数字媒体增强、智能功效管理Penryn家族产品将会完美的继承,但在在之上有所改进和完善。不过Penryn处理器上最大的亮点显然是英特尔45纳米工艺的应用,借助于英特尔High-K金属珊极晶体管技术,Penryn处理器的晶体管能以光速更高效的进行开关。同样的双核产品Penryn比英特尔65纳米产品小了25%,大约仅为普通邮票的四分之一大小。同样得益于High-K金属珊极晶体管技术,Penryn家族的产品功耗水平将会与上一代Conroe产品持平,甚至更低,但性能却有很大的提高。




