【Linux篇】叩响新世界的大门:线程
概念角度:
感性理解线程:
进程:内核数据结构+数据和代码
线程:进程内部的一个执行分支
进程也是被cpu调度,所以进程还有一个执行流的概念
内核与资源角度理解:
进程:
承担分配系统资源的基本实体
线程:
cpu调度的基本单位
我们知道创建进程时,会分配虚拟地址空间,再根据页表找到物理内存然后访问数据。
所以我们可以得知:进程访问大部分数据,都是通过地址空间访问的。地址空间是窗口
不同的进程对应的资源不一样,也就是进程之间的窗口即地址空间不一样。这样进程就具有了独立性
如果创建一批“进程”,共享一个窗口呢?
将一个窗口的资源分配给这些进程,这样就用进程模拟出了“线程”
初步理解:
我们知道,进程访问资源是通过地址空间来访问的,那么对资源的划分本质就是对地址空间的划分,在说简单点就是:“划分虚拟地址”
比如说给“进程1”划分资源,就是在虚拟空间中,划出一小块空间,并将这块空间的起始结束地址给“进程1”
结论1:Linux“线程”可以采用进程来模拟
结论2:对资源的划分,本质是对地址空间虚拟地址范围的划分
-
进程访问资源要通过地址空间找到页表并找到对应的物理空间,最后访问资源,所以对地址空间的访问也就是对资源的访问。
-
虚拟地址就是资源的代表
结论3:代码区其实是虚拟地址的集合。c/c++编写的代码有一个个函数,每个函数的第一行地址就是它的入口地址。所以,让线程执行程序不同的函数即可
结论4:以前所讲的进程,其实是一个单线程进程。
在linux下,对线程调度是复用进程的调度算法
对cpu来说,它不管是进程还是线程,给什么它就调度什么。在它眼里,执行流≤进程。
-
它可能调度的是左边这种多线程进程
-
也可能是调度的右边这种我们历史上所讲的单线程进程
-
不管是进程还是线程,对于linux来说,就是一个个执行流。
-
从硬件cpu视角来看,线程就是轻量级进程
linux下的线程就是轻量级进程,或者说是用轻量级进程模拟实现的
进程强调独占,部分共享(比如通信时候的共享内存) 线程强调共享,部分独占 线程在进程的地址空间内运行
理性角度:
磁盘是以将空间分为4kb大小的数据块来进行管理存储的。
可执行程序就是文件,文件就在磁盘存储,存储的时候天然以4kb为单位进行存储,无论属性还是内容。
物理内存中也是以4kb为单位进行划分的,所以当磁盘与物理内存进行I/O交换时,也是以4kb为单位进行的。
4kb的划分是,OS划分的。不管是磁盘还是内存
物理内存一般为4gb,它可以划分1048576个4kb数据块,这些数据块也会被OS进行统一管理,怎么管理:”先描述,再组织“
将4kb数据块描述成"struct page"结构体
然后定义一个struct page mem[1048576]数组将它们组织起来管理。这样对一个个4kb空间的管理就变成了对数组的管理了
所以,在位来申请物理内存时,本质就是在查数组,改数据。如果想快速找到对应的page,只要建立内核数据结构的对应关系就行了
用虚拟地址查找物理内存:
为什么用低12位来作为偏移量?
- 虚拟地址共32位,当你要访问同一个页框里不同的数据时,它的偏移量不同(低12),但是它的前20位一定是一样的。另外,低12位的范围是[0,4095],刚好能把页框覆盖。
执行流看到多少资源,本质是在合法情况下,拥有多少虚拟地址,虚拟地址是资源的代表
虚拟地址空间mm_struct+vm_area_struct本质:进程资源的统计数据和整体数据
资源划分:
本质就是地址空间划分
资源共享:
本质就是虚拟地址的共享
线程的深刻理解:
线程进行资源划分本质:
是划分地址空间,在本质,就是在划分页表
线程进行资源共享:
本质是对地址空间的共享,再本质就是对页表条目的共享
线程ID及进程地址空间布局:
线程的概念是维护在库里的,在库内部,一定会存在多个被创建好的线程,库通过"先描述再组织"的方式管理这些线程
struct tcb
{线程状态线程id线程独立的栈结构线程栈大小....
};
在调用pthread_creat()创建线程时:
-
会在库中创建管理块
-
要在内核中创建轻量级进程(调用系统调用clone创建,传入线程要执行的函数与线程栈)
线程属性:
线程pcb,线程控制块