AMD Zen3架构深度解析!揭开性能暴涨39%的秘密( 二 )


AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图
正是基于这些改进 , Zen3架构的IPC提升了多达19% , 来自前端、载入/存储、执行引擎、缓存预取、微操作缓存、分支预测等部分的合力贡献 。
那么大家可能会疑惑了 , 19%这个数字怎么来的?
AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图
说起来也简单 , Zen3、Zen2架构都固定在8核心、4GHz频率 , 然后对比不同应用的性能变化 , 最后综合而来 。
不同工作负载的提升幅度当然不尽相同 , 变化最大的是锐龙之前的弱项网游 , 吃鸡、LOL、CSGO这些提升了多达35-39% , 再加上频率提升等 , 最终大家就看到了锐龙5000在网游里边翻天覆地的变化 。
事实上 , 提升幅度超过19%平均水平的 , 基本都是游戏 , 也正因为如此 , 锐龙5000才在游戏性能上夺走了Intel的最后一处阵地 , 有资格说自己是最好的游戏处理器 。
提升幅度相对较小的是一些基准性质项目和一些难以深度优化的游戏 , 尤其是单线程性能 , 比如POV-Ray 9%、CPU-Z 12%、CineBench R20 13% , CineBench R15 18% , 但即便如此大家也看到了非常明显的实际性能提升 , 这可比某几代酷睿每次最多5%左右的变化良心太多了 。
如果你觉得前边讲的架构不过瘾 , 想了解更深入 , 接下来我们就拆解成不同模块 , 单独来看一看它们的变化 。
AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图
前端部分 , Zen3打造了一个更快的分支预测器 , 可以在每个时钟周期内处理更多指令 , 同时在操作缓存、指令缓存之间切换更加快速 , 应付不同工作负载更加灵活高效 。
当然 , 分支预测不可能百分之百准确 , 都是有概率的 , 有时候会预测错误 , 这时候的关键就是能不能快速恢复 , Zen3就大大降低了这时候的延迟 , 可以快速回到正轨 , 分支预测的精度也得到提升 。
AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图
拾取与解码部分 , 这里可以看到分支预测器的更多细节 , 尤其是精度提升是怎么来的 , 比如分支目标缓冲重新设计、L1 B2B容量翻倍、L2 B2B重新组织、间接目标阵列(ITA)增大、流水线缩短、错误预测延迟降低等等 。
同时 , 32KB 8路关联的一级指令缓存进行了优化 , 从而改进预取能力和利用率 。
操作缓存也更加精炼 , 队列拾取效率更高 , 操作缓存与指令缓存流水线的切换也更加自如 。
AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图
执行引擎方面 , 增加了浮点和整数分发宽度 , 降低了FMAC延迟 , 还增大了执行窗口 。
AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图
AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图
整数执行方面 , 整数调度器节点从92个增至96个(4×24分布) , 用来重命名逻辑寄存器以提升乱序执行效率的物理寄存器文件也从180个增至192个 。
每时钟周期的分发也从7个增至10个 , 包括4个ALU(算术逻辑单元)、3个AGU(地址生成单元)、1个分支单元、2个存储数据单元 。
此外 , 记录器缓冲(ROB)所保存的x86指令也从224个增至256个 。
Zen3里的整数单元没变还是4个 , 但共享了ALU、AGU调度器 , 应对不同负载时更加均衡 。
AMD Zen3架构深度解析!揭开性能暴涨39%的秘密文章插图


推荐阅读