Python多线程实战:提升并发效率的秘诀
一、前言:为什么需要多任务处理?
在实际开发中,我们经常需要让程序同时执行多个任务,例如:
- 同时下载多个文件;
- 在后台运行耗时计算的同时保持界面响应;
- 并发处理网络请求等。
Python 提供了多种方式来实现并发,其中 多线程 是一种简单且常用的手段。
二、进程与线程基本概念
概念 | 定义 | 特点 |
---|---|---|
进程 | 操作系统资源分配的基本单位 | 拥有独立的内存空间,开销大 |
线程 | CPU 调度的基本单位,依附于进程存在 | 共享所属进程的资源,创建销毁成本低 |
📌 注意:
- 一个进程至少有一个线程(主线程)。
- 多个线程共享进程的资源,但也因此容易引发资源竞争问题。
三、串行 vs 多线程对比示例
示例 1:串行执行两个任务
import timedef task_one():for i in range(2):print("Task one 正在运行...")time.sleep(1)def task_two():for i in range(2):print("Task Two 正在运行...")time.sleep(1)if __name__ == '__main__':start_time = time.time()task_one()task_two()end_time = time.time()print(f"总耗时: {end_time - start_time} 秒")
📌 输出结果:
Task one 正在运行...
Task one 正在运行...
Task Two 正在运行...
Task Two 正在运行...
总耗时: ~4秒
💡 结论:两个函数是顺序执行的,总共耗时约 4 秒。
四、使用 threading 实现多线程
示例 2:多线程执行两个任务
import threading
import timedef task_one(task_name):for i in range(2):print(f"{task_name} 正在运行...")time.sleep(1)def task_two():for i in range(2):print("Task Two 正在运行...")time.sleep(1)if __name__ == "__main__":print("开始多线程执行任务")start = time.time()# 创建线程对象thread1 = threading.Thread(target=task_one, args=("任务线程1",))thread2 = threading.Thread(target=task_two)# 设置守护线程(可选)thread1.daemon = Truethread2.daemon = True# 启动线程thread1.start()thread2.start()# 阻塞主线程,等待子线程完成thread1.join()thread2.join()end = time.time()print(f"总耗时: {end - start} 秒")
📌 输出结果:
任务线程1 正在运行...
Task Two 正在运行...
任务线程1 正在运行...
Task Two 正在运行...
总耗时: ~2秒
💡 结论:两个任务并发执行,总耗时约为 2 秒,说明实现了并行效果。
五、线程的常见操作
1. 获取/设置线程名称
print(thread1.name)
thread1.name = "线程1"
⚠️ 注意:setName()
方法已被弃用,推荐直接通过 .name
属性设置。
2. 守护线程(Daemon Thread)
thread1.daemon = True
📌 作用:当主线程结束时,守护线程也会自动退出。
六、线程调度的无序性
由于线程是由 CPU 时间片调度决定的,所以它们的执行顺序是不确定的。
示例 3:多线程打印顺序混乱
def task():time.sleep(1)print("当前线程是:", threading.current_thread().name)if __name__ == '__main__':for _ in range(10):t = threading.Thread(target=task)t.start()
📌 现象:输出可能乱序甚至穿插,比如“当前线程是”几个字还没打完,另一个线程就开始输出。
💡 原因:print()
不是原子操作,在多线程并发时可能出现交错输出。
七、线程间资源共享与同步问题
示例 4:线程共享全局变量
li = []def writedata():for i in range(5):li.append(i)time.sleep(1)print("写入的数据是:", li)def readdata():print("读取的数据是:", li)if __name__ == "__main__":wd = threading.Thread(target=writedata)rd = threading.Thread(target=readdata)wd.start()wd.join() # 确保先写后读rd.start()rd.join()
📌 说明:线程之间可以访问和修改同一个全局变量。
示例 5:资源竞争问题(Race Condition)
counter = 0def increment():global countertemp = countertemp += 1time.sleep(0.0002)counter = tempdef decrement():global countertemp = countertemp -= 1time.sleep(0.0002)counter = tempthreads = []if __name__ == "__main__":for _ in range(50):threads.append(threading.Thread(target=increment))for _ in range(50):threads.append(threading.Thread(target=decrement))for t in threads:t.start()for t in threads:t.join()print(f"期望值为 0,实际值为: {counter}")
📌 问题描述:最终结果不一定是 0,因为多个线程同时操作共享变量导致数据不一致。
八、线程同步机制 —— 使用互斥锁(Lock)
为了避免资源竞争,我们可以使用 threading.Lock()
来保护共享资源。
示例 6:使用 Lock 解决资源竞争问题
import threading
import timecounter = 0
lock = threading.Lock()def increment():with lock:global countertemp = countertemp += 1time.sleep(0.0002)counter = tempdef decrement():with lock:global countertemp = countertemp -= 1time.sleep(0.0002)counter = tempthreads = []if __name__ == "__main__":for _ in range(50):threads.append(threading.Thread(target=increment))for _ in range(50):threads.append(threading.Thread(target=decrement))for t in threads:t.start()for t in threads:t.join()print(f"期望值为 0,实际值为: {counter}")
📌 说明:
with lock:
自动加锁和释放,避免死锁。- 锁必须成对出现,否则可能导致死锁或资源无法释放。
九、总结与建议
✅ 推荐做法:
场景 | 建议 |
---|---|
需要并发执行任务 | 使用 threading.Thread |
控制线程生命周期 | 使用 join() 等待线程结束 |
线程间通信与共享资源 | 加锁(Lock )或使用队列(queue.Queue ) |
资源安全访问 | 使用上下文管理器 with lock: |
简化线程管理 | 可以使用 concurrent.futures.ThreadPoolExecutor |
❗️注意事项:
- 避免在多个线程中同时修改共享变量,除非使用锁保护。
- 多线程并非真正并行(GIL限制),适合 I/O 密集型任务。
- 多线程不适合 CPU 密集型任务,考虑使用多进程或多线程 + 协程结合方案。