当前位置：首页 > news >正文

Linux 信号

news 2025/8/14 18:55:00

1. 基本概念

2. 几种产生方式

3. Core Dump

4. 内核结构和操作接口

5. 捕捉的原理

6. SIGCHLD (17)信号

1. 基本概念

信号是进程之间事件异步通知的一种方式。

在目标进程运行时，操作系统（OS）可以将特定信号 “传递” 给该进程，执行对应的动作。

查看Linux系统中有那些信号： kill -l 【宏】

发现：没有 0， 32， 33号信号

（本文的介绍专注于 1-31 号信号类型的学习）

执行对应的动作即怎么处理：

1. 默认行为 （OS制定）详情可使用 man 7 signal 阅览（大多数为终止这个进程）

2. 提供一个信号处理函数 --- 这种方式称为 捕捉（Catch）一个信号【要求内核在处理该信号时切换到用户态执行这个处理函数（后面详细介绍）】

3. 忽略此信号

系统调用接口：

或者使用更加灵活的 sigaction ,但使用的细致和复杂度也随之增加

注意：SIGKILL(9) 和 SIGSTOP(19) 不能捕捉！

2. 几种产生方式

1. 键盘

Ctrl + c 产生的信号【SIGINT（2）】只能发给前台进程。一般的程序代码不做特殊处理，在Shell启动的都是前台进程；一个命令后面加个&可以放到后台运行,这样Shell不必等待进程结束就可以接受新的命令,启动新的进程。

Shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像这样的信号，比如还有 Ctrl + \ 表示【SIGQUIT (3)】，Ctrl + z 表示【SIGSTOP（19)】

前台进程在运行过程中用户随时可能按下这些快捷键或者后面提到的方式, 这个进程都能收到指定信号, 并在用户空间代码执行对应的动作, 所以信号相对于进程的控制流程来说是异步 (Asynchronous)的。

2. 调用函数接口

3. 软件条件

通常表示程序运行中的异常或需要特定响应的事件。

举例：

1. 管道的同步机制：读端关闭，写端尝试写入已经没有意义，OS发送 SIGPIPE（13）终止写端

2. “闹钟”

#include <unistd.h>

       unsigned int alarm(unsigned int seconds);

调用这个函数可以设定一个 “闹钟” 也就是告诉内核在 seconds 秒之后给当前进程发送 SIGALRM（14）信号，该信号的默认处理动作是终止当前进程。

它的返回值为0 或者前一个闹钟剩余的秒数

当设置参数 seconds == 0时表示取消该闹钟

4. 硬件异常产生信号

硬件异常以某种方式可以被硬件检测到并通知内核，然后内核向当前进程发送适当的信号。

例如，当前进程执行了除以0的指令，CPU的运算单元会产生异常，内核将这个异常解释为 SIGFEP（8）信号发送给进程，默认终止进程。

再比如，当前进程访问了非法内存地址（越界，空指针/野指针的解引用， ...）, MMU会产生异常，内核将这个异常解释成 SIGSEGV（11）号信号发送给进程，默认终止进程。

. . . . . .

3. Core Dump

当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部保存到磁盘上, 文件名通常是core (不同的系统可能不同), 这叫做Core Dump。

进程异常终止通常是因为有Bug, 比如非法内存访问导致段错误, 事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug（事后调试）。

一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。

默认是不允许产生core文件的, 因为core文件中可能包含用户密码等敏感信息, 不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。

首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024KB:

ulimit -c 查看 core file size 大小

修改： ulimit -c 1024

然后尝试写一个异常代码，或者给它发送信号比如 SIGFEP

运行失败后，就可以看到对应的 core文件

使用以下命令启动 GDB 并加载可执行文件和 core 文件：

db your_program（崩溃的可执行文件） core

查看程序崩溃位置：

(gdb) bt

更多gdb的调试操作可点击前往小编的另一篇文章《Linux基础开发工具》查看。

4. 内核结构和操作接口

首先，对上面提到的内容做总结表述

1. 实际执行信号的处理动作称为信号递达（Delivery）

2. 信号从产生到递达之间的状态称为信号未决（Pending）

3. 进程可以选择阻塞（Block）某个信号，即屏蔽：可以收到，但不递达

4. 被阻塞的信号将始终保持在未决状态，直到进程解除对此信号的阻塞，才递达

需要注意的是：忽略也是递达的方式之一，和阻塞不是同一个概念！

信号在内核中的表示示意图：

开头所说，操作系统（OS）可以将特定信号 “传递” 给某个进程，其 “传递” 的意思是：OS修改该进程对应的内核数据结构（如上），记录信号状态。

每个信号有两个标志位分别表示阻塞（Block）和未决（Pending）,还有一个函数指针指向递达动作。

收到信号时，内核在进程控制块中设置该信号的未决标志，直到信号递达才修改该标志。

从上图来看, 每个信号只有一个bit的未决标志,非0即1, 不记录该信号产生了多少次, 阻塞标志也是这样表示的。

因此, 未决和阻塞标志可以用相同的数据类型sigset_t来存储, sigset_t 称为信号集, 这个类型可以表示每个信号的“有效”或“无效”状态, 在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中 “有效”和“无效”的含义是该信号是否处于未决状态。

阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask)。

至于这个类型内部如何存储这些bit则依赖于系统实现, 从使用者的角度是不必关心的, 使用者只能调用以下函数来操作sigset_ t变量, 而不应该对它的内部数据做任何解释, 比如用printf直接打印sigset_t变量是没有意义的：

#include <signal.h>
 int sigemptyset(sigset_t *set);
 int sigfillset(sigset_t *set);
 int sigaddset (sigset_t *set, int signo);
 int sigdelset(sigset_t *set, int signo);
 int sigismember（const sigset_t *set, int signo);

函数 sigemptyset 初始化set所指向的信号集, 使其中所有信号的对应bit清零, 表示该信号集不包含任何有效信号。

函数 sigfillset 初始化set所指向的信号集, 使其中所有信号的对应bit为1，表示该信号集的有效信号包括系统支持的所有信号。

注意, 在使用sigset_ t类型的变量之前, 一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

这四个函数都是成功返回0,出错返回-1。

sigismember是一个布尔函数, 用于判断一个信号集的有效信号中是否包含某种信号, 若包含则返回1, 不包含则返回0, 出错返回-1。

对 sigset_t 类型的变量做好设置后，就可以用下面的两个函数接口，把它数据修改到进程内核结构中，影响进行的执行：

1. sigprocmask

#include <signal.h>
 int sigprocmask(int how, const sigset_t *set, sigset_t *oset); 
返回值:若成功则为0,若出错则为-1

如果oset是非空指针, 则读取进程的当前信号屏蔽字通过oset参数传出。

如果set是非空指针, 则更改进程的信号屏蔽字, 参数how指示如何更改：

SIG_BLOCK ：当前集合和set参数的并集

SIG_UNBLOCK ：将 set 信号集中的信号从当前进程的信号屏蔽字中移除

SIG_SETMASK ：重新设置当前进程的信号屏蔽字为 set

2. sigpending

#include <signal.h>

    int sigpending(sigset_t *set);

读取当前进程的未决信号集,通过set参数传出; 调用成功则返回0,出错则返回-1。

5. 捕捉的原理

到这，我们还有最后一个问题没有解决：信号的处理（递达）时机？

—— 通常是内核态到用户态的切换过程中

关于什么是内核态，什么是用户态，简单来说就是：

用户态执行受限的操作，访问受限的资源

内核态可执行所以操作，访问所有资源

举个例子：

比如涉及到：read(), write(), wait() 等操作；进程调度切换时，重新获得CPU，进行上下文切换时；...... 都会导致进程进入内核态

因为硬件上有相关机制来标识和支持两种状态，通常是寄存器，比如序状态字寄存器（PSW）或状态寄存器（SR）等，其中的某些位可以用来表示当前处理器处于用户态还是内核态。

至于为什么这样做的根本原因就是：OS作为软硬件资源的管理者，负责整个计算机的安全和稳定，用户的一切操作都不能跨过它，特别是涉及到底层文件数据的敏感性操作，软硬件需要统筹提供一些安全策略和机制。

下面是一张过程示意图：

这里需要特别解释的是：信号的产生是异步的，它可以在进程执行的任何时刻发生，与进程当前正在执行的代码路径（如main函数中的代码）没有直接的顺序关系。也就是说 sighandler 和 main 函数使用不同的堆栈空间, 它们之间不存在调用和被调用的关系, 是两个独立的控制流程，所以：递达动作结束后，还要返回内核态，读取内核保存的当前进程上下文数据，保证返回用户态后从正确的位置继续。

至于是怎么做到的，你还记得下面的地址空间图吗：