CPU的一些基本知识总结

关于CPU和程序的执行
CPU是计算机的大脑 。
1、程序的运行过程 , 实际上是程序涉及到的、未涉及到的一大堆的指令的执行过程 。
当程序要执行的部分被装载到内存后 , CPU要从内存中取出指令 , 然后指令解码(以便知道类型和操作数 , 简单的理解为CPU要知道这是什么指令) , 然后执行该指令 。再然后取下一个指令、解码、执行 , 以此类推直到程序退出 。
2、这个取指、解码、执行三个过程构成一个CPU的基本周期 。
3、每个CPU都有一套自己可以执行的专门的指令集(注意 , 这部分指令是CPU提供的 , CPU-Z软件可查看) 。
正是因为不同CPU架构的指令集不同 , 使得x86处理器不能执行ARM程序 , ARM程序也不能执行x86程序 。(Intel和AMD都使用x86指令集 , 手机绝大多数使用ARM指令集) 。
注:指令集的软硬件层次之分:硬件指令集是硬件层次上由CPU自身提供的可执行的指令集合 。软件指令集是指语言程序库所提供的指令 , 只要安装了该语言的程序库 , 指令就可以执行 。
4、由于CPU访问内存以得到指令或数据的时间要比执行指令花费的时间长很多 , 因此在CPU内部提供了一些用来保存关键变量、临时数据等信息的通用寄存器 。
所以 , CPU需要提供 一些特定的指令 , 使得可以从内存中读取数据存入寄存器以及可以将寄存器数据存入内存 。
此外还需要提供加法、减、not/and/or等基本运算指令 , 而乘除法运算都是推算出来的(支持的基本运算指令参见ALU Functions) , 所以乘除法的速度要慢的多 。这也是算法里在考虑时间复杂度时常常忽略加减法次数带来的影响 , 而考虑乘除法的次数的原因 。
5、除了通用寄存器 , 还有一些特殊的寄存器 。典型的如:

  • PC:program counter , 表示程序计数器 , 它保存了将要取出的下一条指令的内存地址 , 指令取出后 , 就会更新该寄存器指向下一条指令 。
  • 堆栈指针:指向内存当前栈的顶端 , 包含了每个函数执行过程的栈帧 , 该栈帧中保存了该函数相关的输入参数、局部变量、以及一些没有保存在寄存器中的临时变量 。
  • PSW:program status word , 表示程序状态字 , 这个寄存器内保存了一些控制位 , 比如CPU的优先级、CPU的工作模式(用户态还是内核态模式)等 。
6、在CPU进行进程切换的时候 , 需要将寄存器中和当前进程有关的状态数据写入内存对应的位置(内核中该进程的栈空间)保存起来 , 当切换回该进程时 , 需要从内存中拷贝回寄存器中 。即上下文切换时 , 需要保护现场和恢复现场 。
7、为了改善性能 , CPU已经不是单条取指-->解码-->执行的路线 , 而是分别为这3个过程分别提供独立的取值单元 , 解码单元以及执行单元 。这样就形成了流水线模式 。
例如 , 流水线的最后一个单元——执行单元正在执行第n条指令 , 而前一个单元可以对第n+1条指令进行解码 , 再前一个单元即取指单元可以去读取第n+2条指令 。这是三阶段的流水线 , 还可能会有更长的流水线模式 。
8、更优化的CPU架构是superscalar架构(超标量架构) 。这种架构将取指、解码、执行单元分开 , 有大量的执行单元 , 然后每个取指+解码的部分都以并行的方式运行 。比如有2个取指+解码的并行工作线路 , 每个工作线路都将解码后的指令放入一个缓存缓冲区等待执行单元去取出执行 。
CPU的一些基本知识总结

文章插图
 
9、除了嵌入式系统 , 多数CPU都有两种工作模式:内核态和用户态 。这两种工作模式是由PSW寄存器上的一个二进制位来控制的 。
10、内核态的CPU , 可以执行指令集中的所有指令 , 并使用硬件的所有功能 。
11、用户态的CPU , 只允许执行指令集中的部分指令 。一般而言 , IO相关和把内存保护相关的所有执行在用户态下都是被禁止的 , 此外其它一些特权指令也是被禁止的 , 比如用户态下不能将PSW的模式设置控制位设置成内核态 。
12、用户态CPU想要执行特权操作 , 需要发起系统调用来请求内核帮忙完成对应的操作 。其实是在发起系统调用后 , CPU会执行trap指令陷入(trap)到内核 。当特权操作完成后 , 需要执行一个指令让CPU返回到用户态 。


推荐阅读