【Linux】Linux 地址空间 + 页表映射的概念解析
前言:欢迎各位光临本博客,这里小编带你直接手撕**,文章并不复杂,愿诸君**耐其心性,忘却杂尘,道有所长!!!!

《C语言》
《C++深度学习》
《Linux》
《数据结构》
《数学建模》
文章目录
- Linux线程解析
- 一、进程与线程的核心区别
- 二、地址空间:线程共享的“窗口”
- 三、线程的本质:多执行流并行
- 四、Linux为什么用进程模拟线程?
- 五、其他平台的线程实现
- 六、Linux线程的调度与称呼
- 七、资源划分:共享与独占
- 八、物理内存管理:4KB页框
- 页框的地址计算
- 申请物理内存的本质
- 九、虚拟地址与页表映射
- 32位虚拟地址的划分(经典两级页表)
- 页表映射过程
- 附:简单线程创建示例(修正编译说明)
Linux线程解析
一、进程与线程的核心区别
- 进程 = 内核数据结构(如PCB) + 代码和数据(执行流)
- 线程:进程内部的“执行分支”,是更轻量的执行流
内核视角的资源与调度:
- 进程:系统资源分配的基本单位(占内存、文件描述符等)
- 线程:CPU调度的基本单位(被CPU直接调度执行)
二、地址空间:线程共享的“窗口”
进程访问资源的核心是“地址空间”——它像一个“窗口”,通过这个窗口能看到进程拥有的所有资源(代码、数据、堆、栈等)。
创建进程时,系统会为它单独申请一套地址空间(窗口),包含所有资源;
而创建线程时,线程会共享进程的地址空间(同一个窗口):

(单进程的地址空间:一个窗口对应一个执行流)

(多线程共享地址空间:一个窗口对应多个执行流)

(多线程共享地址空间的结构:多个task_struct共用一套资源)
三、线程的本质:多执行流并行
-
资源分配的本质:划分虚拟地址
地址空间里的虚拟地址,本质是“资源的代表”。比如代码区、数据区、堆区的虚拟地址范围,就是进程/线程能访问的资源范围。 -
多线程如何并行?
多个线程(task_struct)共享同一地址空间,但可以分配不同的虚拟地址范围(比如执行不同函数),从而实现“同一进程内的并行执行”:

(多线程在同一地址空间内执行不同函数,实现并行)
-
函数与代码区的划分
函数本质是“一段连续的虚拟地址”,线程执行不同函数,就是在代码区中选择不同的虚拟地址范围执行。 -
进程与线程的关系
单进程可以看作“只有一个线程的特殊情况”:

(单线程进程是多线程进程的特例)
四、Linux为什么用进程模拟线程?
Linux的线程并非单独设计,而是通过“轻量级进程(LWP)”模拟实现——复用了进程的内核管理代码(如task_struct、调度逻辑)。
原因很简单:
- 复用现有进程管理代码,无需重新设计线程管理模块,降低开发成本;
- 保持内核的简洁与健壮性。

(Linux复用进程内核代码管理线程,成本更低)
五、其他平台的线程实现
不同操作系统的线程实现不同:
- Windows:单独设计“线程控制块(TCB)”管理线程,内核中需单独维护线程的调度信息,实现更复杂;
- 核心思想一致:线程是调度单位,共享进程资源,但具体实现细节因系统而异。
六、Linux线程的调度与称呼
- 操作系统视角:线程和进程都是“执行流”,调度算法无需区分;
- 硬件视角:Linux内核中无独立“TCB”,用户态线程通过“轻量级进程(LWP)”与内核交互,每个用户态线程对应一个LWP;
- 内核用task_struct统一描述进程和LWP,每个线程有自己的入口函数,被CPU当作独立执行流调度:

(每个线程的task_struct对应独立执行流,共享进程资源)
七、资源划分:共享与独占
- 进程:强调“独占”(独立地址空间、资源),仅通过通信机制共享部分数据;
- 线程:强调“共享”(同一地址空间、代码、数据、文件描述符等),独占资源包括线程栈、寄存器状态、程序计数器(PC)、线程私有数据(TLS)。
形象说:进程像“独立的公司”,线程像“公司内的团队”——团队共享公司资源,各自执行不同任务,共同完成公司目标。
八、物理内存管理:4KB页框
硬件与系统对内存的管理,都以“4KB”为基本单位:
- 磁盘文件、物理内存均按4KB块存储/管理,这个块称为“页框”或“页帧”;
- 内核用
struct page描述每个4KB页框:

(struct page结构体:描述4KB页框的属性)
页框的地址计算
- 早期内核中,
struct page会被组织成数组(如struct page mem[1048576]),该大小对应4GB物理内存(1048576×4KB=4GB),数组下标即页框索引; - 页框起始物理地址 = 数组下标 × 4KB;
- 具体物理地址 = 页框起始地址 + 页内偏移(0~4095):

(物理地址由页框起始地址和页内偏移组成)
申请物理内存的本质
就是修改struct page数组的状态(标记某页框为“已分配”),建立“进程/线程”与“页框”的对应关系。
九、虚拟地址与页表映射
程序访问的是“虚拟地址”,需通过“页表”转换为物理地址。
32位虚拟地址的划分(经典两级页表)
32位x86架构的经典两级页表中,虚拟地址被分为3部分:
- 前10位:页目录索引;
- 中10位:页表索引;
- 后12位:页内偏移(4KB=2¹²,12位可覆盖0~4095的偏移范围)。
页表映射过程
- 用前10位查“页目录”,找到对应“页表”的物理地址;
- 用中10位查“页表”,找到目标“物理页框”的起始地址;
- 用后12位(页内偏移)定位到具体字节:

(页目录→页表→物理页框:虚拟地址到物理地址的转换)
附:简单线程创建示例(修正编译说明)
用C语言的pthread库创建线程(体现线程共享地址空间),编译时需链接pthread库(加-lpthread参数):
#include <stdio.h>
#include <pthread.h>// 共享变量(线程共享同一地址空间,可直接访问)
int shared = 0;// 线程1执行函数
void *thread1(void *arg) {shared++;printf("线程1:shared = %d\n", shared);return NULL;
}// 线程2执行函数
void *thread2(void *arg) {shared++;printf("线程2:shared = %d\n", shared);return NULL;
}int main() {pthread_t tid1, tid2;// 创建线程pthread_create(&tid1, NULL, thread1, NULL);pthread_create(&tid2, NULL, thread2, NULL);// 等待线程结束(避免主线程提前退出)pthread_join(tid1, NULL);pthread_join(tid2, NULL);// 主线程也能访问sharedprintf("主线程:shared = %d\n", shared);return 0;
}
编译命令:gcc -o thread_demo thread_demo.c -lpthread
输出(共享变量被两个线程修改,顺序可能因调度略有差异):
线程1:shared = 1
线程2:shared = 2
主线程:shared = 2
