当前位置：首页 > news >正文

Linux系统编程——进程地址空间

news 2025/10/2 5:48:52

32位计算机有32位的地址和数据总线，2^32 种信号组合、寻址空间；每个地址对应 1 个字节byte 的内存空间（计算机存储的基本单位），理论上最大内存容量为 4294967296 byte = 4 GB

进程运行时，内核会为该进程提供一个 虚拟内存视图 —— 进程地址空间

进程地址空间中的地址称为 线性地址 or 虚拟地址；进程地址空间让每个进程认为自己独占了整个连续的内存空间；实际上进程地址空间中的虚拟地址是通过页表映射到不连续的 物理内存中。

mm_struct

进程地址空间，本质是内核的一个 数据结构对象，类似于 PCB，进程地址空间也是需要被操作系统内核进行管理的；在 linux 系统中，描述进程地址空间的数据结构为 mm_struct，也是将结构体指针声明在进程的 PCB —— task_struct 中，进行管理。

进程地址空间 / 程序地址空间 / 虚拟地址空间存在的意义：

1、让所有进程以统一的视角看待内存，让无序的物理内存变为 有序的虚拟内存

2、在进程需要访问物理内存时，增加一个中间过程：可以对寻址请求进行审查，一旦存在异常访问可以直接拦截；使该请求不会到达物理内存，对 物理内存进行保护；

3、进程地址空间和页表的存在，将 进程管理模块 与 内存管理模块 解耦！

页表

进程处于运行态正在被 CPU 调度时，进程的 PCB--task_struct 被创建，进程地址空间被创建并进行维护；另外，内核会为该进程维护一张页表结构，页表是进程地址空间的虚拟地址到物理内存地址的映射；

进程的页表属于进程的硬件上下文数据（当该进程被从 CPU 剥离时，会带走上下文数据）；该进程运行时，CPU 中的 cr3 寄存器会保存当前进程的页表起始地址（需要高频读写的数据放在寄存器），且指向该页表的地址属于物理地址，CPU 通过该物理地址找到对应进程的页表。

页表的标志位

页表的每个地址还有标志位：标志该地址可读还是可写，因为物理内存中没有可读可写的概念，想写就能写，所以通过在页表中为相应地址添加标志位，来表明空间的可读可写属性；所以为什么进程地址空间中的代码区、字符常量区等内存区域就算是只读的，那么它地址处的数据是如何被写入的？ —— 因为内核在对应物理地址写入数据后，修改页表中该地址处的属性为可读，那么对上层来说，这块空间就是只读的！