每个进程“认为”它在计算机上单独运行,并且仅知道其虚拟地址。然后,内存管理单元(MMU)将虚拟地址转换为物理地址。 MMU当然必须确保两个虚拟地址没有映射到相同的物理地址。映射速度非常快,因为CPU(大多数时候)对MMU具有专用的硬件支持。
假设我有一个prog1.c,它被构建为prog1.out。在prog1.out中,有一个链接程序信息,该信息将告诉您将elf加载到的位置。这些地址将是一个虚拟地址。加载程序将查找这些信息,并将其作为过程启动。如链接器中所述,像DS,BSS这样的每个部分都将被加载到虚拟地址上。例如,我的prog2.out也具有相同的加载程序地址,BSS,DS等,那么它将发生冲突吗?我知道这不会冲突,但是会出现性能问题。由于两个进程具有相同的虚拟地址,但它们映射到不同的物理地址?我很困惑,它如何保护具有相同虚拟地址的两个进程。
事实是,当进程使用内存地址时,它是在谈论虚拟地址,该地址可能与同一物理地址不同。这意味着两个进程可以引用相同的地址,并且不会混合它们的数据,因为它将位于两个不同的物理位置。
下面我描述如何在典型计算机上将虚拟地址转换为物理地址(这在其他体系结构上有所不同,但这是相同的想法)
所以,一方面,您有一个虚拟内存地址,并且想要获取一个物理内存地址(即:RAM上的实际地址),工作流程主要是这样的:
虚拟地址-> [分段单元]-> [寻呼单元]->物理地址
每个操作系统都可以定义分段单元和分页的工作方式。例如,Linux使用Flat Segmentation Model,这意味着它将被忽略,因此我们现在将执行同样的操作。
现在,我们的虚拟地址经过称为分页单元的地址,并以某种方式转换为物理地址。这是这样。
内存被分成一定大小的块,在Intel上,此大小可能是4KB或4MB。
每个进程在内存中定义了一组表,因此计算机知道如何转换内存地址。这些表是以分层方式组织的,实际上,要访问的内存地址在这些表的索引中被分解。
我知道,这听起来令人困惑,但请多多讲几句。您可以按照以下图片来写我的文章:
有一个称为CR3的内部CPU寄存器,用于存储第一个表的基地址(我们将这个表称为页面目录,每个表项都称为页面目录项)。当进程正在执行时,其CR3会被加载(以及其他功能)。
所以,现在您要访问内存地址0x00C30404,
分页单元说:“好吧,让我们获取页面目录的基础”,查看CR3寄存器,知道页面目录的基础在哪里,我们将此地址称为PDB(页面目录基础)。
现在,您想知道应该使用哪个目录条目。如前所述,该地址被分解为一堆索引。最重要的10位(第22位通过31位)对应于页面目录的索引。在这种情况下,0x00C30404为0000 0000 1100 0011 0000 0100 0000 0100二进制,其最高有效10位为:0000 0000 11是0x3。这意味着我们要查找第三页目录条目。
请记住,这些表是分层的:每个Page Directory Entry都具有下一个表的地址,该地址称为Page Table。 (此表对于每个页面目录条目可能不同。)>
所以现在,我们得到了另一个表。地址的后10位将告诉我们我们将访问该表的哪个索引(我们将其称为页面表条目)。
00 0011 0000
是接下来的10位,它们是数字:0x30。这意味着我们必须访问第30个Page Table Entry ..最后,此页表条目
保留所需的PAGE FRAME的偏移量(请记住,内存分为4k块)。最后,我们地址的最低有效12位是该PAGE FRAME的内存偏移量,请注意PAGE FRAME是实际的物理内存地址。这被称为3级分页,在64位(或使用PAE)上,这非常相似,但是还有另一级分页。
您可能会认为,获取所有这些内存访问只是为了获取变量是一个真正的遗憾。确实如此。计算机中有一些机制可以避免所有这些步骤,其中一个就是TLB(表后备缓冲区),它存储所有已完成转换的缓存,因此可以轻松获取内存。
此外,这些结构的每个条目都有一些有关权限的属性,例如“此页面可写吗?” “此页面可执行吗?”
因此,既然您了解了内存分页的工作原理,就很容易理解Linux如何处理内存:
每个进程“认为”它在计算机上单独运行,并且仅知道其虚拟地址。然后,内存管理单元(MMU)将虚拟地址转换为物理地址。 MMU当然必须确保两个虚拟地址没有映射到相同的物理地址。映射速度非常快,因为CPU(大多数时候)对MMU具有专用的硬件支持。
MMU还必须弄清楚要从何处准确获取数据,例如主内存(可能是典型的情况),一级缓存,二级缓存,磁盘中的交换文件等。正如我所说,该进程本身就没有意识到,它“认为”它可以在一个平面内存文件上工作,并且不必担心任何碰撞。
(在普通机器中,虚拟地址和物理地址之间没有关系。映射总是发生-这首先是虚拟地址的一部分。
“性能问题”一直存在-甚至始终隐藏在硬件内部。是否存在实际冲突(这些地址是否为物理地址)。
如何保护具有相同虚拟地址的两个进程。
您不需要,也不需要。每个进程的内存内容彼此独立,这是操作系统和硬件的工作来确保这一点。您可以将术语“虚拟内存”视为“特定于进程的自身内存”。
请注意,所有这些讨论实际上与目标代码或链接/加载过程的内容没有多大关系,您可以在运行时引用任何地址,而链接器/加载器不需要知道它。
每个进程“认为”它在计算机上单独运行,并且仅知道其虚拟地址。然后,内存管理单元(MMU)将虚拟地址转换为物理地址。 MMU当然必须确保两个虚拟地址没有映射到相同的物理地址。映射速度非常快,因为CPU(大多数时候)对MMU具有专用的硬件支持。
(在普通机器中,虚拟地址和物理地址之间没有关系。映射总是发生-这首先是虚拟地址的一部分。