操作系统?进程(下)!!!
一、进程创建
认识fork函数
在上一篇进程(上)中讨论有关进程状态时就已经认识过fork函数,感兴趣的可以点击下方链接进行查看:
操作系统?进程(上)!!!
函数原型:

进程调用fork后,内核做:
- 分配新的内存块和内核数据结构给子进程
- 将父进程部分数据结构内容拷贝至子进程
- 添加子进程到系统进程列表当中
- fork返回,开始调度器调度
fork函数产生子进程与父子进程间代码、数据的关系
通过下面一段代码以及运行结果可以看出:
代码:
#include <iostream>
#include <unistd.h>
using namespace std;
int x = 0;
int main(){ printf("fork_before\n");pid_t id= fork(); printf("frok_behind"); return 0;}
** 运行结果:**

从上面运行结果可以看出,fork调用之前代码执行了一次,而在fork调用之后,也即是子进程被创建之后,代码被执行了两次,事实上,这是因为在子进程被调用之后,父子进程共享一段代码和数据,如下图:

注意:在子进程创建之后,谁先被调度完全由调度器决定!
fork函数的返回值
- 对子进程返回0
- 对父进程返回创建的子进程的pid
关于为什么一个返回值可以同时存在两个值这一点,在之前有关进程地址空间的讨论中已经解释过了,感兴趣的可以阅读下面的文章:
操作系统?进程地址空间!!!
简单解释一下:就是说子进程在创建时它有自己的一块连续内存块叫做进程地址空间,同时有一个“页表”,页表映射了进程地址空间中的“虚拟内存”和“物理内存”的关系,事实上对于父子进程的id并不存在在同一个值里面,父子进程通过页表将同一个虚拟内存映射成了不同的物理内存,这才造成了一个id存在多个值的假象
写时拷贝
通常来讲,父子进程的代码共享,事实上,父子再不写入时,数据也是共享的,这时候“页表”上的标志位上标志着未被写入过的数据是只读的,但是在任意一方尝试写入时,操作系统不会报错,反而是将对应的数据为父子进程都拷贝一份,再去进行访问,在检测到只读后停止继续访问的过程叫做缺页中断,这一点在进程地址空间中也有详细解释,同时拷贝的过程就被称为写时拷贝,具体的过程如下图:

frok的用法
- 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子
进程来处理请求。 - 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数
frok函数调用失败的原因
- 系统中已经有太多的进程
- 用户的进程数超过了限制
二、进程终止
不知道大家是否一直有一个小问题,就是我们的C/C++代码为什么要return 0,为什么不return 1或是其它呢?接下来的部分可能会解决你的疑问。
进程退出的场景
- 代码运行完毕,结果正确
- 代码运行完毕,结果不正确
- 代码异常终止
对于一个程序,在运行之后,作为一个程序员我们关心它是否正确运行,如果运行结果不正确,我们就要知道它为什么不正确,同时作为一个进程的父进程,需要接受并且处理子进程的退出码,所以,一个程序在运行结束时,我们要关注退出码的情况,那么,规范、正确的写退出码就格外的重要
ps:在我们日常写的程序都是单一的进程,同时又都有打印的输出逻辑,但是试想,如果一段代码没有打印逻辑,只是进行运算,同时又在一个父子体系当中,这时候程序员、父进程想知道一个进程推出情况如何,就只能借助退出码了
进程退出的常见方法
- 正常终止
- 从main函数返回
- 调用exit函数
- 调用_exit函数
- 异常终止
调用_exit函数终止
#include <unistd,h>
void _exit(int status);
//参数:status是进程的终止状态,父进程通过进程等待获取该值,从而得到子进程的退出信息
注意:
status虽然是int类型,但是只有低8位被父进程使用,所以当status为-1时,父进程实际获得的值是255
调用exit终止
#Include <unistd.h>
void exit(int status);
exit最后会调用_exit函数,但是在这之前,它会做如下一些工作:
- 执行用户通过 atexit或on_exit定义的清理函数。
- 关闭所有打开的流,所有的缓存数据均被写入
- 调用_exit
所以_exit与exit的关系如下图:

return退出
return退出是最常见的程序退出方式,return与exit的本质区别是exit在任何代码块遇到都会直接退出,而return退出只有在main函数中才可以退出进程,这是因为,main函数也是被其它函数调用的,而在上层函数中main函数的return值被作为了exit的参数
异常终止
注意:
异常会直接打断程序的进行,此时退出码无意义!!!
获取最近一次程序执行的退出码以及strerror函数、errno变量
获取最近一次程序执行后的退出码
看下面一段代码及其运行结果:
代码:
#include<stdio.h>
#include<unistd.h>
int main(){printf("i am a process\n");return 1;
}
运行结果:

从上面的运行结果可以看出** echo $? **指令可以打印最近一次程序执行后的返回值,事实上,从这里我们也可以看出,bash作为我们所写的进程的父进程,可以获取子进程的退出码,我们也可以推测,在获取了退出码之后,它会根据退出码的不同,来进行相应的操作
strerror函数
strerror函数原型:

该函数存在在string.h这个头文件当中,它可以获取一个退出码所对应的错误信息,我们来使用一下,并且看一下对应的运行结果:
代码:
#include <stdio.h>
#include <strerror.h>
int main(){for(int i = 0; i <= 108; i++){printf("%d : %s", i, strerror(i));}return 0;
}
运行结果:

从上面的代码及运行结果我们可以看出,strerror函数可以帮我们拿到对应的出错信息,这也就是说,我们可以当代码运行完毕,得到的退出码不是0时,也就是推出错误时,我们可以借助这个函数,来知道错误信息是什么
errno变量
errno变量是存在在errno.h头文件的一个全局变量,存储着最近一次出错的错误码,也就是说在可能出错的函数调用之后我们就可以通过使用**strerror(errno)**的返回值来知道对应函数是否出错
我们通过下面一段代码和运行结果来体会:
代码:
#include <unistd.h>
#include <string.h>
#include <errno.h>
#include <stdlib.h>
int main(){void* pv = malloc(1024*1024*1024*10);printf("%d : %s", errno, strerror(errno));return 0;
}
运行结果:

三、进程等待
为什么要进行进程等待
- 之前讲过,子进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏。
- 另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼”的kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程。
- 最后,父进程派给子进程的任务完成的如何,我们需要知道。如,子进程运行完成,结果对还是不对,或者是否正常退出。
- 父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息
进程等待的方法
- wait方法
#include<sys/types.h>#include<sys/wait.h>pid_t wait(int*status);返回值:成功返回被等待进程pid,失败返回-1。
参数:输出型参数,获取子进程退出状态,不关心则可以设置成为NULL
- waitpid方法
pid_ t waitpid(pid_t pid, int *status, int options);
返回值:当正常返回的时候waitpid返回收集到的子进程的进程ID;如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:pid:Pid=-1,等待任一个子进程。与wait等效。Pid>0.等待其进程ID与pid相等的子进程。status:WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)options:WNOHANG: 若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进
程的ID
+ 如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
+ 如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。
+ 如果不存在该子进程,则立即出错返回。
获取子进程的status
- wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
- 如果传递NULL,表示不关心子进程的退出状态信息。
- 否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
- status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位):

父进程以非阻塞形式等待子进程退出的代码
#include <stdio.h>
#include <unistd.h>#include <stdlib.h>#include <sys/wait.h>int main(){pid_t pid;pid = fork();if(pid < 0){printf("%s fork error\n",__FUNCTION__);return 1;}else if( pid == 0 ){ //childprintf("child is run, pid is : %d\n",getpid());sleep(5);exit(1);} else{int status = 0;pid_t ret = 0;do{ret = waitpid(-1, &status, WNOHANG);//非阻塞式等待if( ret == 0 ){printf("child is running\n");}sleep(1);}while(ret == 0);if( WIFEXITED(status) && ret == pid ){printf("wait child 5s success, child return code is :%d.\n",WEXITSTATUS(status));}else{printf("wait child failed, return.\n");return 1;}}return 0;}
四、进程程序替换
程序替换的原理
用fork函数创建的进程后执行的是和父进程相同的程序,但是当子进程调用一种exec系列函数之后,该进程的用户空间代码和数据将会被新程序替换,事实上是将“页表”中对应虚拟地址的映射位置直接改变成新代码、数据的位置,这样就可以执行对应的程序,具体流程如下图:

注意:
调用exec系列函数不创建新进程,只是替换了代码和数据,所以调用前后exec前后pid并未改变
替换函数
函数原型
有六种以exec开头的系列函数,统称为exec函数:
#include <unistd.h>`库函数:int execl(const char *path, const char *arg, ...);int execlp(const char *file, const char *arg, ...);int execle(const char *path, const char *arg, ...,char *const envp[]);int execv(const char *path, char *const argv[]);int execvp(const char *file, char *const argv[]);
系统调用:int execve(const char *path, char *const argv[], char *const envp[]);**库函数都是通过调用系统调用实现的!**
上面的函数进行一个简单的解释,使用时查询一下即可:
l --- list,列表传值
v --- vector, 数组传值
p --- path, 对于命令,自动查在PATH之下查找路径
e --- env, 自己维护环境变量
再对**execlp**进行一个简单解释:
参数列表不需要传进程路径,同时以链表形式传参,传参和命令行中输入类似,列表以NULL结尾
函数解释
- 这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。
- 如果调用出错则返回-1
- 所以exec函数只有出错的返回值而没有成功的返回值。
调用举例
#include <unistd.h>int main(){char *const argv[] = {"ps", "-ef", NULL};char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};execl("/bin/ps", "ps", "-ef", NULL);// 带p的,可以使用环境变量PATH,无需写全路径execlp("ps", "ps", "-ef", NULL);// 带e的,需要自己组装环境变量execle("ps", "ps", "-ef", NULL, envp);execv("/bin/ps", argv);// 带p的,可以使用环境变量PATH,无需写全路径execvp("ps", argv);// 带e的,需要自己组装环境变量execve("/bin/ps", argv, envp);exit(0);}
关系

简单应用
代码:
#include <iostream>
#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
using namespace std;
int main(){int x; cin >> x;if(x == 1){//调用ls -apid_t id = fork();if(id == 0){execlp("ls", "ls", "-a", NULL);}else if(id){wait(0);}}else if(x == 2){//调用ls -lpid_t id = fork();if(id == 0){execlp("ls", "ls", "-l", NULL);}else if(id){wait(0);}}else if(id){cout << "cin error\n";}return 0;
}
运行结果:

五、结语
上面就是本文关于进程控制相关的所有知识了,欢迎大家和我一起学习、进步!!!!!
