prescott核心—CPUPrescott架构是什么意思?( 二 )


X2 。
这是非常不成功的核心 , 因为它的高频低能 , 使得Athlon64大获成功 , 直到酷睿2出现 , 英特尔才挽回性能优势!
Q6:CPUPrescott架构是什么意思?Prescott采用增强的NetBurst架构 , 增强了指令预取 , 提高了分支预测精度 , 先进的能源管理 。Prescott还增加了超线程(HT)技术 , 增加了SSE3指令 。
Prescott增强了分支预测精度 , 当指令分支预测失败时 , 处理器会清除和重新填充管线 , 显然管线越长对性能的损失就越大 , 因此提高分支预测精度就显得很重要了 。尽管NetBurst架构的分支预测算法已经很高效 , Intel仍然进一步提高它的效率 。NetBurst架构的分支预测单元的执行是基于分支预测缓存(BTB) , 这是一个4KB的缓存 , 存储已经完成分支的统计表 。换句话说 , Intel的分支预测是基于概率模型 , 这个算法提供了非常高的效率 , NorthWood的分支预测单元平均每一百条指令只有0.86个出错的预测 , 新的Prescott把出错的分支预测降低的0.75个 , 相当于减少了12%的出错率 , 因此Prescott清除和重新填充执行管线的延迟更低 。
快速的指令执行 , 新的处理器核心具有相同数量的整数运算单元 , 它有两个整数运算单元能够以双倍的核心频率进行简单指令处理 , 另有一个的算术运算单元(ALUs)进行复杂的指令处理 , Prescott小幅修改了它的算术运算单元 。首先Intel在一个快速算术运算单元中加入了shifter(位移)/rotator(旋转)单元 , 可以使ALUs在执行shifts和rotations指令时更加快速 。
Prescott处理器的整数乘法的性能也得到了提高 , 在之前Intel的NetBurst架构中 , 整数乘法是由FPU(浮点处理单元)执行的 , 它需要完成转换到浮点格式和转回整数模式的操作 。Prescott的整数乘法由整数运算单元完成 , 执行效率更高 。根据测试 , shifts和rotations指令的性能提高了四倍 , 整数乘法的执行速度提高了25% 。
Prescott具有更大的16KB L1和1MB L2 Cache , ntel改进了Prescott的分支预测单元 , 指令调度和整数执行核心 , 以适应增加的管线长度(pipeline stages) 。
更长的管线 , 31 stages , Intel证实Prescott使用更长的流水线长度来推进处理器频率的提高 , 更长的管线意味着分支预测失败会带来更大的性能损失 。Intel把Pentium 4的Trace Cache后面的管线延长了10 stages , 假如在trace cache之前的decoding stages保持不变 , 这意味着Prescott总共有39(31+8)stages , 在大多数情况下 , 这八个额外的stages不会受分支预测失败的影响 , 也就是说流水线失效的部分是解码后的部分 。
增强的超线程 , Intel的工程师通过不同方式修改Prescott处理器 , 让它的超线程性能更好 。增加了共享的资源可以允许更多类型的操作并行处理 , in flight存储的指令数量从24个增加到32个 , 这些改进允许多指令更好的并行处理 , 同时Prscott加入了调节功能 , 减少两个逻辑处理器对L1 Cache的争夺 。
Prescott新增13条新的指令(SSE3) , 为提高特定应用程序性能设计的新指令 , 主要应用于多媒体和游戏应用 。这些指令包括五个方面:浮点到整数的转换 , 复数运算 , 视频压缩 , SIMD(单指令多数据)浮点使用AOS格式和线程同步指令 。
关于prescott和prescott核心的介绍到此就结束了 , 不知道你从中找到你需要的信息了吗?如果你还想了解更多这方面的信息 , 记得收藏关注本站 。
查看更多关于prescott的详细内容...
Tags:prescottprescott核心


推荐阅读