Linux中《进程控制》详细介绍
目录
- 进程创建
- fork函数初识
- fork函数返回值
- 写时拷贝
- fork常规用法
- 进程终止
- 进程退出场景
- 进程常见退出方法
- exit()函数
- _exit()函数
- return退出
- 退出码
- 进程等待
- 为什么要进程等待?
- 进程等待的方法
- wait方法
- waitpid方法
- 获取子进程status
- 阻塞与非阻塞等待
- 进程程序替换
- 替换原理
- 替换函数
- 函数解释
- 命名理解
- 函数认识
进程创建
fork函数初识
在linux中fork函数是⾮常重要的函数,它从已存在进程中创建⼀个新进程。新进程为⼦进程,⽽原进程为⽗进程。
#include <unistd.h>
pid_t fork(void);
返回值:子进程中返回0,⽗进程返回⼦进程id,出错返回-1
进程调⽤fork,当控制转移到内核中的fork代码后,内核做:
• 分配新的内存块和内核数据结构(PCB)给⼦进程
• 将⽗进程部分数据结构内容拷⻉⾄⼦进程
• 添加⼦进程到系统进程列表当中
• fork返回,开始调度器调度
当⼀个进程调⽤fork之后,就有两个⼆进制代码相同的进程。⽽且它们都运⾏到相同的地⽅。但每个进程都将可以开始它们⾃⼰的旅程,看如下程序。
这⾥看到了三⾏输出,⼀⾏before,两⾏after。进程525先打印before消息,然后它有打印after。另⼀个after消息有526打印的。注意到进程526没有打印before,为什么呢?如下图所⽰:
所以,fork之前⽗进程独⽴执⾏,fork之后,⽗⼦两个执⾏流分别执⾏。注意,fork之后,谁先执⾏完全由调度器决定。
fork函数返回值
• ⼦进程返回0,
• ⽗进程返回的是⼦进程的pid。
• 创建失败返回-1
写时拷贝
通常,⽗⼦代码共享,⽗⼦再不写⼊时,数据也是共享的,当任意⼀⽅试图写⼊,便以写时拷⻉的⽅式各⾃⼀份副本。具体⻅下图:
因为有写时拷⻉技术的存在,所以⽗⼦进程得以彻底分离离!完成了进程独⽴性的技术保证!
写时拷⻉,是⼀种延时申请技术,可以提⾼整机内存的使⽤率。
为什么要写时拷贝?
为了回答这个问题,我们可以反向思考一下,如果没有写时拷贝,那么内存中会有两份相同的代码,会造成内存资源的浪费(如果父进程有100个变量,子进程只修改5个变量),同时子进程需要拷贝父进程的数据和代码,也会增加子进程的创建时间。
fork创建子进程失败的可能的原因
a.内存不够(PCB内核数据结构和自己的代码和数据)
b.进程创建进程的数量会有限制
fork常规用法
• ⼀个⽗进程希望复制⾃⼰,使⽗⼦进程同时执⾏不同的代码段。例如,⽗进程等待客户端请求,⽣成⼦进程来处理请求。
• ⼀个进程要执⾏⼀个不同的程序。例如⼦进程从fork返回后,调⽤exec函数。
进程终止
进程终⽌的本质是释放系统资源,就是释放进程申请的相关内核数据结构和对应的数据和代码。
进程退出场景
• 代码运⾏完毕,结果正确
• 代码运⾏完毕,结果不正确
• 代码异常终⽌
进程常见退出方法
正常终⽌(可以通过 echo $? 查看进程退出码):
1. 从main的return返回,其他函数只表示自己函数调用完成。
2. 任何地方调⽤exit,表示进程结束,并返回给父进程子进程的退出码。
3. _exit,终止调用该函数的进程(谁调用它就终止谁)
OS管理进程,只有OS才能杀掉进程,因此exit()的底层一定是封装了_exit()系统调用来完成的。
exit()
vs _exit()
如果exit()退出,会刷新缓冲区
如果_exit()退出,不会刷新缓冲区
exit()函数
#include <unistd.h>
void _exit(int status);
参数:status 定义了进程的终⽌状态,⽗进程通过wait来获取该值
说明:虽然status是int,但是仅有低8位可以被⽗进程所⽤。所以_exit(-1)时,在终端执⾏$?发现返回值是255。
_exit()函数
#include <unistd.h>
void exit(int status);
exit最后也会调⽤_exit, 但在调⽤_exit之前,还做了其他⼯作:
- 执⾏⽤⼾通过 atexit或on_exit定义的清理函数。
- 关闭所有打开的流,所有的缓存数据均被写⼊
- 调⽤_exit
return退出
return是⼀种更常见的退出进程⽅法。执⾏return n等同于执⾏exit(n),因为调⽤main的运⾏时函数会将main的返回值当做 exit的参数。
异常退出:
ctrl + c,信号终⽌
退出码
退出码(退出状态)可以告诉我们最后⼀次执⾏的命令的状态。在命令结束以后,我们可以知道命令是成功完成的还是以错误结束的。其基本思想是,程序返回退出代码 0 时表⽰执⾏成功,没有问题。代码 1 或 0 以外的任何代码都被视为不成功。
Linux Shell 中的主要退出码:
• 退出码 0 表⽰命令执⾏⽆误,这是完成命令的理想状态。
• 退出码 1 我们也可以将其解释为 “不被允许的操作”。例如在没有 sudo 权限的情况下使⽤yum;再例如除以 0 等操作也会返回错误码 1 ,对应的命令为 let a=1/0
• 130 ( SIGINT 或 ^C )和 143 ( SIGTERM )等终⽌信号是⾮常典型的,它们属于128+n 信号,其中 n 表终⽌码。
• 可以使⽤strerror函数来获取退出码对应的描述。
echo $?打印最后一个程序(进程)退出时的退出码,也叫做进程退出码。写到你的PCB里面的,可以联想到僵尸状态下,释放数据和代码,只留下PCB,父进程从子进程僵尸状态下的PCB里,就可以读到子进程的退出结果。
注意:代码异常终止时,退出码无意义。
strerror()
用于获取退出码的含义
进程等待
为什么要进程等待?
进程等待必要性:
之前讲过,⼦进程退出,⽗进程如果不管不顾,就可能造成‘僵⼫进程’的问题,进⽽造成内存泄漏。
另外,进程⼀旦变成僵⼫状态,那就⼑枪不⼊,“杀⼈不眨眼”的kill -9 也⽆能为⼒,因为谁也没有办法杀死⼀个已经死去的进程。
最后,⽗进程派给⼦进程的任务完成的如何,我们需要知道。如,⼦进程运⾏完成,结果对还是不对,或者是否正常退出。
⽗进程通过进程等待的⽅式,回收⼦进程资源,获取⼦进程退出信息
进程等待的方法
wait方法
#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int* status);返回值:
成功返回被等待进程pid,失败返回-1。
参数:
输出型参数,让父进程获取⼦进程退出状态,不关⼼则可以设置成为NULL
如果等待子进程,而子进程没有退出,父进程会阻塞在wait()处,就像scanf()等待输入一样。
waitpid方法
pid_ t waitpid(pid_t pid, int *status, int options);返回值:
当正常返回的时候waitpid返回收集到的⼦进程的进程ID;
如果设置了选项WNOHANG,⽽调⽤中waitpid发现没有已退出的⼦进程可收集,则返回0;
如果调⽤中出错,则返回-1,这时errno会被设置成相应的值以指⽰错误所在;参数:
pid:
Pid=-1,等待任⼀个⼦进程。与wait等效。
Pid>0.等待其进程ID与pid相等的⼦进程。
如果pid不存在,waitpid()会失败,并返回-1
status: 输出型参数
WIFEXITED(status): 若为正常终⽌⼦进程返回的状态,则为真。(查看进程是
否是正常退出)
WEXITSTATUS(status): 若WIFEXITED⾮零,提取⼦进程退出码。(查看进程的
退出码)
options:默认为0,表⽰阻塞等待
WNOHANG: 若pid指定的⼦进程没有结束,则waitpid()函数返回0,不予以等
待。若正常结束,则返回该⼦进程的ID。
- 如果⼦进程已经退出,调⽤wait/waitpid时,wait/waitpid会⽴即返回,并且释放资源,获得⼦进程退出信息。
- 如果在任意时刻调⽤wait/waitpid,⼦进程存在且正常运⾏,则进程可能阻塞。
- 如果不存在该⼦进程,则⽴即出错返回。
获取子进程status
wait和waitpid,都有⼀个status参数,该参数是⼀个输出型参数,由操作系统填充。
如果传递NULL,表⽰不关⼼⼦进程的退出状态信息。
否则,操作系统会根据该参数,将⼦进程的退出信息反馈给⽗进程。
status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16
⽐特位):
WIFEXITED(status)
: 若为正常终⽌⼦进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status)
: 若WIFEXITED⾮零,提取⼦进程退出码。(查看进程的退出码)
阻塞与非阻塞等待
进程的阻塞等待⽅式:
阻塞等待,waitpid()的options为0
非阻塞等待,waitpid()的options为WNOHANG
(return immediately if no child has exited),通过非阻塞轮询的方式,一遍一遍的检查子进程有没有退出,可以通过循环的方式实现,非阻塞等待的好处就是,可以让父进程不在轮询的时候,做自己的事情。
非阻塞调用的返回值
>0,waitpid等待结束
==0,waitpid(id,&status,WNOHANG)调用结束,但子进程没有退出
<0,waitpid等待失败
阻塞调用的返回值
>0,waitpid等待结束
<0,waitpid等待结束
进程程序替换
fork() 之后,⽗⼦各⾃执⾏⽗进程代码的⼀部分如果⼦进程就想执⾏⼀个全新的程序呢?进程的程序替换来完成这个功能!
程序替换是通过特定的接⼝,加载磁盘上的⼀个全新的程序(代码和数据),加载到调⽤进程的地址空间中!
替换原理
⽤fork
创建⼦进程后执⾏的是和⽗进程相同的程序(但有可能执⾏不同的代码分⽀),⼦进程往往要调⽤⼀种exec
函数以执⾏另⼀个程序。当进程调⽤⼀种exec
函数时,该进程的⽤⼾空间代码和数据完全被新程序替换,从新程序的启动例程开始执⾏。调⽤exec
并不创建新进程,所以调⽤exec前后该进程的id并未改变。
失败的情况
替换函数
其实有六种以exec开头的函数,统称exec函数:
#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
函数解释
- 这些函数如果调⽤成功则加载新的程序从启动代码开始执⾏,不再返回。
- 如果调⽤出错则返回-1
- 所以exec函数只有出错的返回值⽽没有成功的返回值。
命名理解
这些函数原型看起来很容易混,但只要掌握了规律就很好记。
• l(list) : 表⽰参数采⽤列表
• v(vector) : 参数⽤数组
• p(path) : 有p⾃动搜索环境变量PATH
• e(env) : 表⽰⾃⼰维护环境变量
函数认识
execl()
execlp()
execv()
execvp()
execvpe()
总结:事实上,只有execve是真正的系统调⽤,其它五个函数最终都调⽤execve,所以execve在man⼿册 第2节,其它函数在man⼿册第3节。这些函数之间的关系如下图所⽰。
exec/exit就像call/return⼀个C程序有很多函数组成。⼀个函数可以调⽤另外⼀个函数,同时传递给它⼀些参数。被调⽤的函数执⾏⼀定的操作,然后返回⼀个值。每个函数都有他的局部变量,不同的函数通过call/return系统进⾏通信。
这种通过参数和返回值在拥有私有数据的函数间通信的模式是结构化程序设计的基础。Linux⿎励将这种应⽤于程序之内的模式扩展到程序之间。如下图
⼀个C程序可以fork/exec另⼀个程序,并传给它⼀些参数。这个被调⽤的程序执⾏⼀定的操作,然后通过exit(n)来返回值。调⽤它的进程可以通过wait(&ret)来获取exit的返回值。