加载地址对于Linux中的所有C程序是否通用?

问题描述 投票:1回答:3

假设我有一个prog1.c,它被构建为prog1.out。在prog1.out中,有一个链接程序信息,该信息将告诉您将elf加载到的位置。这些地址将是一个虚拟地址。加载程序将查找这些信息,并将其作为过程启动。如链接器中所述,像DS,BSS这样的每个部分都将被加载到虚拟地址上。例如,我的prog2.out也具有相同的加载程序地址,BSS,DS等,那么它将发生冲突吗?我知道这不会冲突,但是会出现性能问题。由于两个进程具有相同的虚拟地址,但它们映射到不同的物理地址?我很困惑,它如何保护具有相同虚拟地址的两个进程。

c linux memory-management
3个回答
5
投票

事实是,当进程使用内存地址时,它是在谈论虚拟地址,该地址可能与同一物理地址不同。这意味着两个进程可以引用相同的地址,并且不会混合它们的数据,因为它将位于两个不同的物理位置。

下面我描述如何在典型计算机上将虚拟地址转换为物理地址(这在其他体系结构上有所不同,但这是相同的想法)

了解Intel x86体系结构(3级分页)上的内存转换过程

所以,一方面,您有一个虚拟内存地址,并且想要获取一个物理内存地址(即:RAM上的实际地址),工作流程主要是这样的:

虚拟地址-> [分段单元]-> [寻呼单元]->物理地址

每个操作系统都可以定义分段单元和分页的工作方式。例如,Linux使用Flat Segmentation Model,这意味着它将被忽略,因此我们现在将执行同样的操作。

现在,我们的虚拟地址经过称为分页单元的地址,并以某种方式转换为物理地址。这是这样。

内存被分成一定大小的块,在Intel上,此大小可能是4KB或4MB。

每个进程在内存中定义了一组表,因此计算机知道如何转换内存地址。这些表是以分层方式组织的,实际上,要访问的内存地址在这些表的索引中被分解。

我知道,这听起来令人困惑,但请多多讲几句。您可以按照以下图片来写我的文章:

“

有一个称为CR3的内部CPU寄存器,用于存储第一个表的基地址(我们将这个表称为页面目录,每个表项都称为页面目录项)。当进程正在执行时,其CR3会被加载(以及其他功能)。

所以,现在您要访问内存地址0x00C30404

分页单元说:“好吧,让我们获取页面目录的基础”,查看CR3寄存器,知道页面目录的基础在哪里,我们将此地址称为PDB(页面目录基础)。

现在,您想知道应该使用哪个目录条目。如前所述,该地址被分解为一堆索引。最重要的10位(第22位通过31位)对应于页面目录的索引。在这种情况下,0x00C304040000 0000 1100 0011 0000 0100 0000 0100二进制,其最高有效10位为:0000 0000 110x3。这意味着我们要查找第三页目录条目。

¿我们现在要做什么?

请记住,这些表是分层的:每个Page Directory Entry都具有下一个表的地址,该地址称为Page Table。 (此表对于每个页面目录条目可能不同。)>

所以现在,我们得到了另一个表。地址的后10位将告诉我们我们将访问该表的哪个索引(我们将其称为页面表条目)。

00 0011 0000

是接下来的10位,它们是数字:0x30。这意味着我们必须访问第30个Page Table Entry ..

最后,此页表条目

保留所需的PAGE FRAME的偏移量(请记住,内存分为4k块)。最后,我们地址的最低有效12位是该PAGE FRAME的内存偏移量,请注意PAGE FRAME是实际的物理内存地址。

这被称为3级分页,在64位(或使用PAE)上,这非常相似,但是还有另一级分页。

您可能会认为,获取所有这些内存访问只是为了获取变量是一个真正的遗憾。确实如此。计算机中有一些机制可以避免所有这些步骤,其中一个就是TLB(表后备缓冲区),它存储所有已完成转换的缓存,因此可以轻松获取内存。

此外,这些结构的每个条目都有一些有关权限的属性,例如“此页面可写吗?” “此页面可执行吗?”

因此,既然您了解了内存分页的工作原理,就很容易理解Linux如何处理内存:

  • 每个进程都有其自己的CR3,并且在计划运行该进程时,会加载cr3寄存器。
  • 每个进程都有其自己的虚拟空间(表可能不完整,一个进程可以仅以4kb的单个页面开头)。
  • 每个进程都映射了其他页面(操作系统内存),因此,当它被中断时,中断处理程序将在同一任务上启动并处理该任务中的中断,并执行所需的代码。
  • 这种方案的一些动机
    • 您不必同时拥有所有进程的内存,您可以将它们存储在磁盘中。

  • 您可以安全地隔离每个进程的内存,并为其分配一些权限。
  • 一个进程可能使用10MB的ram,但是不需要它们在物理内存中是连续的。

每个进程“认为”它在计算机上单独运行,并且仅知道其虚拟地址。然后,内存管理单元(MMU)将虚拟地址转换为物理地址。 MMU当然必须确保两个虚拟地址没有映射到相同的物理地址。映射速度非常快,因为CPU(大多数时候)对MMU具有专用的硬件支持。

MMU还必须弄清楚要从何处准确获取数据,例如主内存(可能是典型的情况),一级缓存,二级缓存,磁盘中的交换文件等。正如我所说,该进程本身就没有意识到,它“认为”它可以在一个平面内存文件上工作,并且不必担心任何碰撞。

(在普通机器中,虚拟地址和物理地址之间没有关系。映射总是发生-这首先是虚拟地址的一部分。

“性能问题”一直存在-甚至始终隐藏在硬件内部。是否存在实际冲突(这些地址是否为物理地址)。

如何保护具有相同虚拟地址的两个进程。

您不需要,也不需要。每个进程的内存内容彼此独立,这是操作系统和硬件的工作来确保这一点。您可以将术语“虚拟内存”视为“特定于进程的自身内存”。

请注意,所有这些讨论实际上与目标代码或链接/加载过程的内容没有多大关系,您可以在运行时引用任何地址,而链接器/加载器不需要知道它。


1
投票

每个进程“认为”它在计算机上单独运行,并且仅知道其虚拟地址。然后,内存管理单元(MMU)将虚拟地址转换为物理地址。 MMU当然必须确保两个虚拟地址没有映射到相同的物理地址。映射速度非常快,因为CPU(大多数时候)对MMU具有专用的硬件支持。


1
投票

(在普通机器中,虚拟地址和物理地址之间没有关系。映射总是发生-这首先是虚拟地址的一部分。

© www.soinside.com 2019 - 2024. All rights reserved.