彻底搞懂虚拟地址翻译为物理地址的过程( 二 )


TLB全称叫做翻译后备缓冲器,这是一个映射表,它建立了虚拟页号(VPN)和页表项(PTE)的映射关系,每次访问虚拟地址时,都需要找这个虚拟地址对应的页表项,每次都去内存中查需要耗费几十个甚至上百个的时钟周期,虽然页表项缓冲在高速缓冲后,耗费的周期可以降到1-2个周期,但是缓冲在TLB后,几乎不用耗费时钟周期,它跟CPU几乎是同步的,类似于寄存器 。
那么,虚拟地址怎么通过TLB映射页表项(PTE)呢,先来看看TLB,我们说TLB就是一个映射表,先来看看这个映射表长什么样,如下图

彻底搞懂虚拟地址翻译为物理地址的过程

文章插图
 
如上图所示,一个TLB由m个TLB组构成,每个TLB组下有个n个条目,每个条目里有PTE和标记位构成 。
标记位是一个数字,每个TLB组的标记位不能重复,所以一个TLB组里,可以根据这个标记位定位到某个条目 。
每个组都有一个唯一的编号叫做组号 。
因此这么看,TLB就是一个二维数组,知道了组号和标记位就可以定位到唯一的PTE(页表项) 。
虚拟地址中的虚拟页号(VPN)可以拆分成两部分即组号和标记位,假设一个n位长度的虚拟地址,如下图
彻底搞懂虚拟地址翻译为物理地址的过程

文章插图
虚拟地址中的TLB部分
由上图得知,VPN由标记位(TLBT)和组号又叫标记索引(TLBI)构成,组号占t位,标记位占了虚拟页号剩余的位 。
假如一个TLB有4组,总共有64个条目,每组就有16个条目,那么VPN中的组号就占用2位(2的2次方=4),标记位就占用4位(2的4次方=16) 。
高速缓冲
高速缓冲通常采用SRAM(静态随机访问存储器)进行存储,它比内存DRAM(动态随机访问存储器)快上几十甚至上百倍,因此为了加速CPU获取数据的速度,最近访问的数据存储在高速缓冲中 。
高速缓冲内部有一张映射表,这张映射表建立内存物理地址PA和该内存物理地址下内容的映射关系,如下图所示
彻底搞懂虚拟地址翻译为物理地址的过程

文章插图
高速缓冲映射表
【彻底搞懂虚拟地址翻译为物理地址的过程】如上图所示,映射表分为m个组,每个组由标记位,有效位,和n个块组成,有效位为1表示该缓冲没过期,为0表示该缓冲过期了 。
一个物理地址由组号+标记位+块号构成,如下图所示
彻底搞懂虚拟地址翻译为物理地址的过程

文章插图
物理地址的构成
由上图得知,物理地址为m位,块号占用p位,组号占用t为,剩下的位就是标记位占用的位数 。
我们可以根据物理地址的组号定位到映射表的一个组,然后看看这个组下的有效位是不是为1,如果不为1,那么表示这一组的内容都无效了,没有必要比较下去了,因此缓冲没有命中,如果为1呢,那么比较这个组下的标记位和物理地址中标记位,如果不相等,那就是没有命中,如果相等呢,则继续根据物理地址中的块号去这个组相应的块号下找,如果找到数据,则表示命中了,否则缓冲没有命中 。
假设一个高速缓冲有16个组,每个组有4个块,那么物理地址当中组号占用的空间就是4位(2的4次方等于16),块号占用的位数就是2位(2的2次方等于4),剩余的位数就是标记位占用的位数 。
好了,概念普及完了,下面正式开始举例
先假设
1.内存是按字节寻址,每个字是一个字节(通常对于32位的系统一个字是4个字节) 。
2.虚拟地址长度为14位,假设页表有256个页表项,因此虚拟页号(VPN)占用位数为8,虚拟一偏移量(VPO)占用6位 。
3.物理地址长度为12位 。
4.页面大小为64个字节(P=64)
5.TLB有4个组,每个组4个条目,总共16个条目组成
6.高速缓冲(L1)有16个组,每个组有4个块 。
7.采用一级页表(多级页表复杂些,但原理类似) 。
先看看虚拟地址和物理地址的格式,如下图:
彻底搞懂虚拟地址翻译为物理地址的过程

文章插图
虚拟地址
由上图得知,组号(TLBI)占用2位,因为我们假设TLB有4个组,标记位占用6位 。
彻底搞懂虚拟地址翻译为物理地址的过程

文章插图
物理地址
由上图得知,组号(CI)占用4位,因为我们假设高速缓冲有16个组,每个组下有4个块,因此块号(CO)占用2位,剩下的6位就是标记位(CT) 。
我们假定TLB,高速缓冲映射表如下图:
彻底搞懂虚拟地址翻译为物理地址的过程

文章插图


推荐阅读