当前位置：首页 > news >正文

Linux中线程的基本概念

news 2025/11/5 18:06:37

1.线程是什么

2.Linux中的线程

重新理解进程

3.线程的优缺点

优点

缺点

1.线程是什么

学习Linux线程之前呢，首先要弄清楚一般的线程，而学习一般的线程之前呢需要弄清楚什么是进程。你可能在一些书本上看到过这样的定义 “进程就是加载到内存中的程序”，这句话不能说他错了，但是呢不够准确，一个程序被加载到内存之后，其本质是这个程序的代码和数据被加载到内存了，操作系统需要为加载到内存的程序创建PCB数据结构，所以，进程 = PCB数据结构+代码和数据，而线程就是进程内部的一个执行分支。

我们可以以函数为例来理解，我们把每个函数单独的看成一个执行分支，每个函数在执行的时候，只会运行函数自己的代码，多个函数共同瓜分了进程的代码。

我们以下面这段代码来理解：

#include <iostream>
#include <unistd.h>
using namespace std;

void func1()
{
    int cnt = 5;
    while(cnt--)
    {
        cout << "Hello I am func1, I am running" << endl;
        sleep(1);
    }
}

void func2()
{
    int cnt = 5;
    while(cnt--)
    {
        cout << "Hello I am func2, I am running" << endl;
        sleep(1);
    }
}

int main()
{
    func1();
    func2();
    return 0;
}

既然线程是进程内部的一个执行分支，那就说明进程内部可以存在多个线程，而操作系统中也可以存在多个进程，于是，他们之间的关系可以用下面这张图表示：

我们以前说的进程就是单线程进程。
以前的多线程就是多个单线程进程。

2.Linux中的线程

我们已经知道一般的线程是什么了，那Linux中的线程是怎样的呢？

在Linux系统中未来肯定会存在多个线程，操作系统肯定要管理好多个线程，所以操作系统的设计者需要为线程设计数据结构，例如Linux进程的数据结构是struct task_struct。

操作系统的设计者认线程和进程都是执行流，具有极高的相似性，并且进程的算法和数据结构已经很完善了，没有必要再单独为线程设计数据结构和算法，于是在Linux系统中，线程的设计是直接模拟进程，复用进程的数据结构和算法。

Linux系统中，线程的设计复用进程的数据结构和算法，所以，Linux系统中描述线程的数据结构还是task_struct，只不过对于CPU来说，现在的 task_struct 比以前的 task_struct 更加的轻量化一些了，所以，在Linux系统中，线程其实就是轻量级进程。未来，不管是进程还是线程，CPU只要看到了task_struct，就会拿过来运行调度，所以，在Linux中，所有的调度执行流都叫做轻量级进程。

Linux中进程线程示意图：

线程在进程内部运行，本质是在进程地址空间内运行。进程内部的所有线程共享一个进程地址空间，透过进程地址空间，可以看到进程的大部分资源，将进程资源合理分配给每个执行流，就形成了线程执行流。

重新理解进程

以前我们对进程的理解是站在调度的角度，现在有了线程，我们对进程的理解应该站在系统资源的角度进行理解。

从内核的观点出发，进程其实是承担系统资源分配的基本实体，线程是CPU调度的基本单位。

举个例子：我们这个社会上存在了太多的资源，比如车子、房子、票子，而每个家庭就是承担社会资源的基本实体，家庭中由很多人，爸爸负责赚钱养家，妈妈负责貌美如花，你就负责上学，每个人其实就相当于家庭内部的执行流。

线程共享进程的数据，但是线程也有自己独立的一部分数据：

独立的栈结构
线程的硬件上下文数据
线程ID
信号屏蔽字
调度优先级

3.线程的优缺点

优点

1.创建一个新线程的代价要比创建一个新进程小得多。

创建一个线程只需要创建task_struct结构即可，而创建一个进程不仅需要创建task_struct结构，还需要创建进程地址空间、页表，并且还要在页表中建立蓄力地址和物理地址的映射关系。

2.与进程之间的切换相比，线程之间的切换需要操作系统做的工作要少很多。

无论是线程还是进程，在被切换的时候都需要保存自己的进程上下文，而线程的上下文只比进程的上下文少一点。那为什么说线程切换比进程切换需要操作系统做的工作很少呢？
这是因为CPU内部有一个叫做Cache的缓存硬件，CPU会根据 局部性原理 将当前进程运行所的需要的数据周围的数据都加载到Cache缓存中，以此减少CPU和内存之间的IO次数，来提高运行效率。
进程切换的时候，Cache中的数据是要被清空的，并且重新将自己的数据加载到Cache缓存中，这个过程需要和外设进行IO，是一个很缓慢的过程。
而线程切换不一样，线程是进程内部的执行流，线程切换的时候不需要清空Cache缓存中的数据，也就不需要和外设进行IO，因此操作系统做的工作很少。

3.线程占用的资源要比进程少很多。