Linux 原来是这么管理内存的( 二 )


Linux 内存管理实现内存管理系统是操作系统最重要的部分之一 。从计算机早期开始,我们实际使用的内存都要比系统中实际存在的内存多 。内存分配策略克服了这一限制,并且其中最有名的就是 虚拟内存(virtual memory) 。通过在多个竞争的进程之间共享虚拟内存,虚拟内存得以让系统有更多的内存 。虚拟内存子系统主要包括下面这些概念 。
大地址空间
操作系统使系统使用起来好像比实际的物理内存要大很多,那是因为虚拟内存要比物理内存大很多倍 。
保护
系统中的每个进程都会有自己的虚拟地址空间 。这些虚拟地址空间彼此完全分开,因此运行一个应用程序的进程不会影响另一个 。并且,硬件虚拟内存机制允许内存保护关键内存区域 。
内存映射
内存映射用来向进程地址空间映射图像和数据文件 。在内存映射中,文件的内容直接映射到进程的虚拟空间中 。
公平的物理内存分配
内存管理子系统允许系统中的每个正在运行的进程公平分配系统的物理内存 。
共享虚拟内存
尽管虚拟内存让进程有自己的内存空间,但是有的时候你是需要共享内存的 。例如几个进程同时在 shell 中运行,这会涉及到 IPC 的进程间通信问题,这个时候你需要的是共享内存来进行信息传递而不是通过拷贝每个进程的副本独立运行 。
下面我们就正式探讨一下什么是 虚拟内存
虚拟内存的抽象模型在考虑 Linux 用于支持虚拟内存的方法之前,考虑一个不会被太多细节困扰的抽象模型是很有用的 。
处理器在执行指令时,会从内存中读取指令并将其解码(decode),在指令解码时会获取某个位置的内容并将他存到内存中 。然后处理器继续执行下一条指令 。这样,处理器总是在访问存储器以获取指令和存储数据 。
在虚拟内存系统中,所有的地址空间都是虚拟的而不是物理的 。但是实际存储和提取指令的是物理地址,所以需要让处理器根据操作系统维护的一张表将虚拟地址转换为物理地址 。
为了简单的完成转换,虚拟地址和物理地址会被分为固定大小的块,称为 页(page) 。这些页有相同大小,如果页面大小不一样的话,那么操作系统将很难管理 。Alpha AXP系统上的 Linux 使用 8 KB 页面,而 Intel x86 系统上的 Linux 使用 4 KB 页面 。每个页面都有一个唯一的编号,即页面框架号(PFN) 。

Linux 原来是这么管理内存的

文章插图
 
上面就是 Linux 内存映射模型了,在这个页模型中,虚拟地址由两部分组成:偏移量和虚拟页框号 。每次处理器遇到虚拟地址时都会提取偏移量和虚拟页框号 。处理器必须将虚拟页框号转换为物理页号,然后以正确的偏移量的位置访问物理页 。
上图中展示了两个进程 A 和 B 的虚拟地址空间,每个进程都有自己的页表 。这些页表将进程中的虚拟页映射到内存中的物理页中 。页表中每一项均包含
  • 有效标志(valid flag): 表明此页表条目是否有效
  • 该条目描述的物理页框号
  • 访问控制信息,页面使用方式,是否可写以及是否可以执行代码
要将处理器的虚拟地址映射为内存的物理地址,首先需要计算虚拟地址的页框号和偏移量 。页面大小为 2 的次幂,可以通过移位完成操作 。
如果当前进程尝试访问虚拟地址,但是访问不到的话,这种情况称为 缺页异常,此时虚拟操作系统的错误地址和页面错误的原因将通知操作系统 。
通过以这种方式将虚拟地址映射到物理地址,虚拟内存可以以任何顺序映射到系统的物理页面 。
按需分页由于物理内存要比虚拟内存少很多,因此操作系统需要注意尽量避免直接使用低效的物理内存 。节省物理内存的一种方式是仅加载执行程序当前使用的页面(这何尝不是一种懒加载的思想呢?) 。例如,可以运行数据库来查询数据库,在这种情况下,不是所有的数据都装入内存,只装载需要检查的数据 。这种仅仅在需要时才将虚拟页面加载进内中的技术称为按需分页 。
交换如果某个进程需要将虚拟页面传入内存,但是此时没有可用的物理页面,那么操作系统必须丢弃物理内存中的另一个页面来为该页面腾出空间 。
如果页面已经修改过,那么操作系统必须保留该页面的内容,以便以后可以访问它 。这种类型的页面被称为脏页,当将其从内存中移除时,它会保存在称为交换文件的特殊文件中 。相对于处理器和物理内存的速度,对交换文件的访问非常慢,并且操作系统需要兼顾将页面写到磁盘的以及将它们保留在内存中以便再次使用 。


推荐阅读