当前位置: 首页 > news >正文

linux_线程概念

线程特征:是进程内的执行分支,线程的执行粒度,要比进程要细。

1.理解Linux线程

线程<=执行流<=进程 

线程实际上是复用进程的数据结构和管理算法,进程的task struct,实际上是模拟线程,部分书中说Linux没有真正意义上的线程是不太准确的的,因为用进程模拟的线程,实际上复用了进程的内核的数据结构,从功能角度,Linux 的轻量级进程完全能实现线程的核心功能(如共享地址空间、并发执行),且用户态通过 pthread 库可屏蔽内核实现细节,对开发者而言与“真正的线程”无实质区别。因此,不能说 Linux“没有线程”,只是实现方式特殊。

在以往我们所谈到的进程中,操作系统其实是以进程为单位给我们分配资源,我们当前的进程的内部只有一个执行流。

在Linux的实现方案中,线程在进程内部执行,线程在进程的地址空间内运行。其原因是任何执行流要执行都要有资源,而地址空间是进程的资源窗口同时线程的执行力度要比进程更细,其本质原因是线程执行进程的代码的一部分

2.线程和进程的定义

 线程:线程操作系统调度的基本单位

进程:内核观点进程是承担分配系统资源的基本实体,进程=内核数据结构+代码和数据

执行流: 执行流也是资源,因为线程是进程内部的执行力资源

3.重谈地址空间

X86的特点便是起始地址+类型=起始地址+偏移量 

如int类型对该变量取地址,实际上拿到的是他的第1字节个地址

4.Linux线程的周边概念

以下从 缓存(cache)相关过程 和 线程切换效率更高的原因 两方面展开,结合图中 Linux 线程、进程的架构逻辑来讲:

一、缓存(cache)相关过程

图里的 “cache(缓存)”,核心是 CPU 缓存与进程/线程数据的关联 :

- 程序运行时,CPU 会把高频访问的内存数据(比如进程/线程的指令、常用变量等)暂存到 CPU 缓存里 。这样做是为了 减少 CPU 直接访问物理内存的次数(内存读写速度远低于 CPU 运算速度,缓存能当 “高速中转站”)。
- 对进程/线程来说,这些缓存里的 “热数据” 是它们高效运行的基础 。比如线程执行时,常用的  task_struct  部分信息、虚拟内存映射的关键数据,可能就存在缓存里,CPU 直接从缓存取数据,能大幅加快执行效率。

简单说,缓存就是给 CPU 快速 “存取常用数据” 开的 “绿色通道” ,让进程/线程跑起来更流畅,少等内存读写的 “延迟”。

、线程切换效率更高的原因

从图中 Linux 进程、线程的架构(共享虚拟地址空间、 task_struct  等)来看,线程切换比进程切换 “更轻量”,核心原因在这两点:

1. 地址空间 & 资源共享层面

- 进程切换:
进程有独立的虚拟地址空间( mm_struct  管理),切换时,CPU 缓存里的旧进程地址、数据会被 “清空/替换” ,还要重新加载新进程的页表、地址空间等一大堆资源(相当于换了一套全新的 “运行环境”),这一步特别耗时 。
- 线程切换:
同一进程里的线程 共享虚拟地址空间( mm_struct  是共用的)!切换时,不需要动页表、地址空间这些 “大块头”,缓存里的热数据(比如进程内共享的代码、全局变量缓存)大概率还能用 ,省去了重新加载地址空间的巨大开销。

2. PCB( task_struct )切换层面

- 进程切换:
除了地址空间,进程的  task_struct  里还得处理一大堆独立资源(文件描述符、信号量等),切换时要把这些状态全部 “保存 - 恢复”,流程复杂、耗时多。
- 线程切换:
线程的  task_struct  虽然也有自己的执行上下文(比如寄存器状态、程序计数器),但 共享了进程级的大部分资源(文件、信号等)。切换时,主要就是改改寄存器、程序计数器这些 “小状态”,比起进程切换要简单得多,自然更快 。

总结一下:

- 缓存过程 是 CPU 为了加速程序运行,把常用数据临时存在 “高速缓存” 里;
- 线程切换更快 ,是因为线程共享了进程的地址空间、大部分资源,切换时不用像进程那样 “大动干戈” 换地址空间、重新加载大量资源,所以效率更高 。
需要注意的是线程有属于自己的上下文和栈

 

5.线程的优缺点:一把双刃剑

(一)线程的优点

1. 创建与切换成本低:创建新线程比创建新进程划算多了。打个比方,创建进程就像在电脑里“新建”一个独立的软件环境,要分配很多资源;而线程就像是在同一个软件里开个“小分支”,资源共享,所以轻松不少。线程切换时,操作系统要做的工作也少,就像在同一个房间里换个角落干活,比跑到另一个房间方便。

2. 资源占用少:线程占的资源比进程少很多,这样就能同时运行更多线程,充分利用 CPU 的多核能力,让程序跑得更快。

3. 提升程序效率:要是程序需要等待慢速的 I/O 操作(比如读写文件、网络请求),线程可以在等待的时候去做别的任务,不浪费时间。对于计算密集型任务,把计算拆分成多个线程,能让多核 CPU 一起发力;对于 I/O 密集型任务,多个线程同时等待不同的 I/O 操作,也能提高整体性能 。

(二)线程的缺点

1. 性能损失:如果有很多计算密集型线程,处理器忙不过来,线程之间切换和同步会增加额外开销,就像好几个人挤在一个小房间干活,互相干扰,效率反而变低。

2. 健壮性降低:写多线程程序得特别小心。线程之间时间分配的小偏差,或者不小心共享了不该共享的变量,都可能出问题。而且线程之间缺乏保护,一个线程出问题,可能连累整个程序。

3. 缺乏访问控制:进程是访问控制的基本单位,线程里调用一些操作系统函数,可能影响整个进程,就像一个线程在“大团队”里搞破坏,会牵连所有人。

4. 编程难度高:多线程程序又难写又难调试。要考虑线程同步、竞争条件这些问题,稍微不注意就出错,比单线程程序复杂多了 。

http://www.dtcms.com/a/275460.html

相关文章:

  • 死锁的概念 ⚠️
  • 告别频繁登录!Nuxt3 + TypeScript + Vue3实战:双Token无感刷新方案全解析
  • TinyBERT:知识蒸馏驱动的BERT压缩革命 | 模型小7倍、推理快9倍的轻量化引擎
  • python-for循环
  • 【Elasticsearch】昂贵算法与廉价算法
  • UI前端大数据可视化实战策略分享:如何设计符合用户认知的数据可视化流程?
  • 让 VSCode 调试器像 PyCharm 一样显示 Tensor Shape、变量形状、变量长度、维度信息
  • 「日拱一码」025 机器学习——评价指标
  • Android音视频探索之旅 | C++层使用OpenGL ES实现音频渲染
  • 单片机学习笔记.根据芯片数据手册写驱动程序(这里使用的是普中开发版,以DS1302为例)
  • 创建Spring Boot项目
  • 解决‘vue‘ 不是内部或外部命令,也不是可运行的程序
  • 前端开发的「设计鸿沟」:为什么我学了CSS却做不出好看的网页?
  • 用YOLOv5系列教程(1)-用YOLOv5轻松实现设备状态智能监控!工业级教程来了
  • 【工具】什么软件识别重复数字?
  • C++结构体的定义与使用
  • 机器学习(ML)、深度学习(DL)、强化学习(RL)关系和区别
  • Redis 基本操作笔记
  • 关于wpf的自适应
  • 基于 Redisson 实现分布式系统下的接口限流
  • [特殊字符] 深入掌握 dsquery:Active Directory 高效查询与安全运维指南
  • sqli-labs靶场通关笔记:第7-8关 布尔盲注
  • Gemini CLI 代理问题解决[API Error: exception TypeError: fetch failed sending request]
  • 【Linux-云原生-笔记】数据库操作基础
  • 【机器学习|学习笔记】详解决策树CART算法,并对比ID3 C4.5和CART算法
  • 系统分析师-计算机系统-计算机系统概述存储系统
  • 内网穿透系列九:开源的网络穿透与组网工具 EasyTier,支持多种数据传输通道,去中心化,兼具高效与安全
  • 【Java八股文总结 — 包学会】(二)计算机网络
  • PyTorch的计算图是什么?为什么绘图前要detach?
  • 【设计模式】单例模式 饿汉式单例与懒汉式单例