力压Core 2 Duo AMD四核K8L架构技术预览

来源:太平洋电脑网 作者: 2007-12-11 出处:pcdog.com

上一页 1 2 3 4 5 6 7 下一页 

三、K8L构架的指令派遣 - 速度加倍

  K8构架在每一时钟周期内可以从L1缓存中读取16字节的核心数据,这意味着K8构架处理器可以在一周期内同时完成并行的3条5字节的指令处理任务。

很明显的例子,拥有寄存器处理能力的SSE2指令是4字节的(例如MOVAPD XMM0, XMM1),间接寻址指令则有6-8字节,如果是64位模式同时使用寄存器、添加REX前缀的SSE2指令则将增加至7-9字节。(SSE在标量情况下将与之相同,矢量情况下会少1字节。)

  所以,每周期16字节的取指令派遣速度不能保证K8构架CPU能每周期完成3条指令,但是因为在K8构架中SSE/SSE2矢量指令必须要分两部分来完成这3条指令,所以16字节的取指令速度还可以满足K8构架的64位FPU数据处理需求。但是在未来的K8L构架中,一周期连续指令将增加到3指令或者更多条,这样16字节的取指令能力就不能够满足了。

力压Core 2 Duo AMD四核K8L架构技术预览(图四)

  如图2,未来K8L构架的32字节数据取指令能力可以在一周期读取5条指令,而过去的K8构架取指令最大16字节的能力则需要将其延时一倍的时间。    

    · K8构架每周期发出6条宏指令(分别解码为9条微指令),整数列队容量为最大24条宏指令。

    · K8L构架每周期发出8条宏指令(分别解码为11条微指令),整数列队容量为最大32条宏指令。

    · CORE构架每周期发出8条宏指令(分别解码为11条微指令),整数列队容量为最大32条宏指令。

  CORE构架的取指令能力也是16字节的,所以它最大也只能满足一周期4条平均4字节的指令。为了解决这个弱点,INTEL设计了特殊的双内置64字节缓冲器来连接发出一条64字节指令,并在一周期内完成连续的32字节指令。

改进的分支预测单元和运算法则

  K8构架的分支预测单元比Conroe的分支预测单元更加简洁高效,但是K8简洁的分支预测单元也同样有着弱点,例如省略了的间接分支预测功能将会影响到其多面体指令的性能,其预测准确率也将低于对手,这也是同频率K8在3D图形性能运用中远不敌Conroe的原因之一。所以在K8L构架中,AMD针对这一重点问题将做一系列大的改进,包括添加更为全面的预测指令和改进预测运算法则等。



上一页 1 2 3 4 5 6 7 下一页 
上一篇:大片即将上演 第四季度CPU决战一触即发
下一篇:迎长假装机热潮 小编教你克服装机五大误区