当前位置: 首页 > news >正文

使用Multiprocessing模块创建子进程,需要放到__main__中

1 场景说明

在Python中,使用multiprocessing模块创建子进程时,将创建子进程的代码放在if __name__ == '__main__': 块之外,如下面代码:

import multiprocessing
import time


def test_func(name):
    print(f"子进程 {name} 开始运行")
    time.sleep(2)  # 模拟任务执行
    print(f"子进程 {name} 结束运行")


# 创建子进程
p = multiprocessing.Process(target=test_func, args=("1",))
# 启动子进程
p.start()
# 等待子进程结束
p.join()
print("主进程结束")

2 问题描述

代码执行过后,报错信息如下:

raise RuntimeError('''
RuntimeError: 
        An attempt has been made to start a new process before the
        current process has finished its bootstrapping phase.

        This probably means that you are not using fork to start your
        child processes and you have forgotten to use the proper idiom
        in the main module:

            if __name__ == '__main__':
                freeze_support()
                ...

        The "freeze_support()" line can be omitted if the program
        is not going to be frozen to produce an executable.

        To fix this issue, refer to the "Safe importing of main module"
        section in https://docs.python.org/3/library/multiprocessing.html

3 原因分析

在 Python 中,使用 multiprocessing 模块创建子进程时,必须将创建子进程的代码放在if __name__ == '__main__':块中。这是因为在 Windows 和 macOS 上,Python 使用spawn方式启动子进程,这种方式会重新导入主模块。如果不将代码放在 if __name__ == '__main__': 块中,会导致子进程重新执行主模块的代码,从而引发递归创建子进程的问题。

4 解决方案

将创建子进程的代码块放到if __name__ == '__main__':

import multiprocessing
import time


def test_func(name):
    print(f"子进程 {name} 开始运行")
    time.sleep(2)  # 模拟任务执行
    print(f"子进程 {name} 结束运行")

if __name__ == '__main__':
    # 创建子进程
    p = multiprocessing.Process(target=test_func, args=("1",))
    # 启动子进程
    p.start()
    # 等待子进程结束
    p.join()
    print("主进程结束")

5 Multiprocessing模块中子进程启动方式

5.2 启动方式说明

在 Python 的 multiprocessing 模块中,子进程的启动方式主要有三种:spawnforkforkserver。不同的操作系统默认使用不同的启动方式,而这些方式的行为和适用场景也有所不同。

5.3 默认启动方式

Windows: 默认使用 spawn
macOS(Python 3.8+): 默认使用 spawn
Linux/Unix: 默认使用 fork

5.4 设置启动方式

import multiprocessing


def worker():
    print("子进程运行")


if __name__ == '__main__':
    # 设置启动方式,可选spawn、fork、forkserver
    multiprocessing.set_start_method('spawn')
    # 如果设置成fork,则会抛异常ValueError: cannot find context for 'fork'
    # 创建子进程
    p = multiprocessing.Process(target=worker)
    p.start()
    p.join()

5.5 如何选择启动方式

Windows/macOS: 默认使用 spawn,无需更改。

Linux/Unix:
如果需要快速启动且不涉及多线程,使用 fork。
如果需要避免资源冲突,使用 forkserver 或 spawn。

5.6 注意事项

5.6.1 多线程与 fork

在 Linux 上,如果父进程中有多线程,使用 fork 可能会导致死锁或资源冲突。在这种情况下,建议使用spawnforkserver

5.6.2 跨平台兼容性

如果代码需要在多个平台上运行,建议使用spawn,因为它是 Windows 和 macOS 的默认方式。

5.7 启动方式比较

启动方式spawnforkforkserver
描述重新启动一个 Python 解释器,只继承主进程中运行进程所需的资源。不会继承父进程的内存状态。直接复制父进程的所有资源(包括内存状态),创建子进程。先启动一个服务器进程,之后每次创建子进程都从该服务器进程 fork。
支持操作系统Windows、macOSLinux、UnixLinux、Unix
优点安全性高,避免了父进程状态不一致的问题。启动速度快,因为直接复制父进程状态。避免了直接 fork 父进程可能导致的问题。
比 spawn 更快,因为服务器进程已经初始化。
缺点启动速度较慢,因为需要重新导入模块和初始化环境。可能导致资源冲突(如文件描述符、锁等)。
在 macOS 上,fork 可能会导致问题(尤其是涉及多线程时)。
需要额外的服务器进程。
适用场景Windows 和 macOS(默认方式)。
需要避免共享父进程状态的场景。
Linux/Unix(默认方式)。
需要快速启动子进程且不涉及多线程的场景。
Linux/Unix。
需要频繁创建子进程且希望避免资源冲突的场景。

相关文章:

  • 【最后203篇系列】021 Q201再计划
  • 《慢慢变富》第三章 估值篇:价值的锚与安全边际
  • 广度优先搜索(BFS)完全解析:从原理到 Java 实战
  • 信创-人大金仓数据库创建
  • 昆仑技术重构AI大模型落地范式,长期作“加法”迎来国产生态化“拐点”
  • Performance Hub Active Report
  • 机器学习之KL散度推导
  • 审视单词:一个单词的10个维度
  • 1.8 函数的连续性和间断点
  • pdm self update 504 gateway timeout
  • PY32F002BW15U7TR
  • C#里使用libxl来合并单元格的例子
  • 深度学习PyTorch之动态计算图可视化 - 使用 torchviz 生成计算图
  • 条件变量,锁,共享数据的关系
  • SSL/TLS 和 SSH 介绍以及他们的区别
  • 用@keyframes-animation来实现动画效果
  • Postgresql 删除数据库报错
  • Springboot实现使用断点续传优化同步导入Excel
  • FastAPI 异步处理模板:高效处理耗时任务,解决使用async api调用时返回顺序不对的问题
  • 深度优先搜索(DFS)完全解析:从原理到 Java 实战
  • 普雷沃斯特当选新一任天主教罗马教皇
  • 外卖员投资失败负疚离家流浪,经民警劝回后泣不成声给父母下跪
  • 顾家家居:拟定增募资近20亿元,用于家居产品生产线的改造和扩建等
  • 习近平出席俄罗斯总统举行的欢迎仪式
  • 纪录片《中国》原班人马打造,《船山先生》美学再升级
  • 司法部谈民营经济促进法:对违规异地执法问题作出禁止性规定