理解计算机系统_并发编程(5)_基于线程的并发(二):线程api和基于线程的并发服务器
前言
以<深入理解计算机系统>(以下称“本书”)内容为基础,对程序的整个过程进行梳理。本书内容对整个计算机系统做了系统性导引,每部分内容都是单独的一门课.学习深度根据自己需要来定
引入
接续上一篇理解计算机系统_并发编程(4)_基于线程的并发(一):线程基础-CSDN博客
Posix线程简介
概念:Posix线程是在C程序中处理线程的一个标准接口.而且在所有Linux系统上都可用.Pthreads定义了大约60个函数,允许程序创建,杀死和回收线程,与对等线程安全地共享数据,还可以通知对等线程系统状态地变化.
---解读:有api可以用是让人兴奋的,代码要写起来.
一个简单的Pthreads程序
主函数(代表主线程)创建一个对等线程,然后等待他的终止.当主线程检测到对等线程终止后,他就通过调用exit终止该进程.
hello.c内容
#include"csapp.h"
void *thread(void *vargp);int main(){pthread_t tid;Pthread_create(&tid,NULL,thread,NULL); //生成对等线程Pthread_join(tid,NULL); //等待对等线程终止exit(0); //终止当前进程中所有线程
}void *thread(void *vargp){printf("Hello,world!\n");return NULL;
}
---解读:从示例代码可以看出:线程和任务是分离的.主程序只管线程的生成和终止.任务由函数thread给出.二者之间的联系在Pthread_create()函数里,两个参数分别传入了函数名thread和代表参数vargp的NULL.---"分离"是构建程序时常用的方法.他的优点是便于模块化代码,也便于分工.
任务函数的分析
本书原话:线程的代码和本地数据被封装在一个线程例程(thread routine)中.正如第二行里的原型所示,每个线程例程都以一个通用指针作为输入,并返回一个通用指针.如果想传递多个参数给线程例程,那么你应该将参数放到一个结构中,并传递一个指向该结构的指针.相似地,如果想要线程例程返回多个参数,你可以返回一个指向一个结构的指针. ---斜体字部分有解释
---解读:通用指针可以表示的数据,理论上是无限的.他可以指向一个结构(或结构数组),结构里面再扩展数据.
这里有一个疑问:"线程例程返回多个参数,可以返回一个指向一个结构的指针",问题是线程例程的返回值在哪里?主函数中并没有接收.
解决方案:输入参数和返回值放进一个结构(vargp)里. 举个例子,声明一个结构表示结果和参数
typedef struct{struct result* res;struct argument* arg;
}res_arg;
给Pthread_create传第4个参数时传入struct res_arg*类型的数据.形参和返回值的数据分别由struct result和struct argument定义.
这种写法的思路是用形参指针接收函数返回值.笔者以前写过:理解计算机系统_网络编程(4)_套接字api-CSDN博客
线程API
创建线程pthread_create()
函数原型如下
typedef void *(func)(void *);int pthread_create(pthread_t *tid,pthread_attr_t *attr,func *f, void *arg); //成功返回值为0,出错为非0
---解读:函数等于任务,用函数指针func表示,然后把函数指针和参数指针传入pthread_create()函数的第3个和第4个形参中,表示函数被放入线程tid中运行.
第1个参数tid理解为生成一个线程ID.结合主函数来看:定义一个pthread_t变量,传入地址给函数.当pthread_create()返回时,参数tid包含新创建线程的ID.---黑体字是原话,佐证
第2个参数attr改变新创建线程的默认属性.本书认为改变这些属性超出学习范围,调用时总传入NULL
获得自己的线程ID函数pthread_self()
函数原型
pthread_t pthread_self(void);
//返回调用者的线程ID
显然获得自己的线程必须在生成线程号之后---必须先调用pthread_create()
终止线程
一个线程的终止的方式:
1.当顶层的线程例程返回时,线程会隐式地终止. ---任务执行后所在线程自动终止,不需要干预
2.通过调用pthread_exit函数,线程会显式地终止.函数原型如下:
void pthread_exit(void *thread_return);
//不返回
3.某个对等线程调用Linux的exit函数,该函数终止进程以及所有与该进程相关的线程.
4.另一个对等线程通过以当前ID作为参数调用pthread_cancel函数来终止当前进程.
---解读:笔者认为以上方法没有多少应用场景,
比如第4条,让一个线程终止另一个线程,意义何在?第3条调用exit函数,相当于强制退出所有线程和进程.第2条由主线程调用后等待并终止,和示例程序中主线程调用exit的意思是相同的,多了一个thread_return可以设置一些数据,而这个工作可以留到"回收已终止线程的资源"里去做.
综上所述,暂时不用多看,用示例里的写法即可.如果有遇到相应场景再来查.
回收已终止线程的资源pthread_join()函数
函数原型
int pthread_join(pthread_t tid,void **thread_return);
//成功返回0,出错则为非0
---解读:函数会阻塞,直到线程终止,回收已终止线程的资源.有两点说明
1>必须指定线程ID,这点和进程中的wait函数不一样,先执行完的子进程调用wait
2>将线程例程返回的通用(void *)指针赋值为thread_return指向的位置.这里解决了上面标题"任务函数的分析"提出的疑问:线程任务运行的返回值去了哪里?线程返回的结构指针,被另一个双重指针接收.
分离线程pthread_detach()函数
线程分离detach和线程结合join是相对的.
本书原话:一个可结合的线程能够被其他线程收回和杀死.在被其他线程回收之前,他的内存资源(例如栈)是不释放的.相反,一个分离的线程是不能被其他线程回收或杀死,他的内存资源在他终止时由系统自动释放.
函数原型
int pthread_detach(pthread_t tid);
//若成功返回0,出错返回非0
同时,线程能够以pthread_self()为参数调用来分离自己.
---解读:线程资源面临释放问题,join和detach二选一.两者对比如下:
join显式释放资源,并接收线程任务返回值(也是显式).
detach自动释放资源,暂时没看见接收线程任务返回值的地方(如果需要接收,可以把输入参数和返回值放进一个结构(vargp)里),写法上detach相对简单一点(见本书P695"基于线程的并发服务器"代码)
初始化线程pthread_once()函数(略)
基于线程的并发echo服务器
本书P695中间echoservert.c,这里代码在之前基础上稍作了修改.还是不难看懂,
注意:
1>第21行代码可以和第8行合并,写到第8行
int *connfdp=Malloc(sizeof(int));
2>第22行,第23行和第30行结合看,把已连接描述符connfd(int类型)先作为指针传入pthread_create,然后在thread函数中,先强转为int型指针,再提取出描述符的写法.
3>第31行线程资源回收调用了detach()函数,在任务中先分离自己,自动回收资源
4>后面讲了出错的原因是"竞争"
小结
线程api的一点理解