欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

【Linux】进程信号

程序员文章站 2022-07-12 11:18:55
...

信号

生活中的信号

  • 程序员小明明天晚上要去和女朋友看电影,但女朋友没有说具体时间,只说了到时候打电话通知小明。在小明等待女朋友电话的过程中,虽然期间女朋友的电话还没来,但是小明内心清楚当电话来了后他要做什么(看电影)。也就是小明能“识别电话”。
  • 当电话响起时,正在改bug的小明突然觉得女朋友没有那么重要了,于是他决定再改半小时。在这半小时内,小明没有去看电影,但他知道女朋友在等他,也就是说看电影的行为并不是一定要立即执行,可以在“合适的时候”执行(此时小明的看电影条件还不成熟)。
  • 在电话响了到小明去看电影是有一个时间窗口的,在这段时间内,小明并没有去看电影,但他知道女朋友在等他。本质上是小明“记住了有个女朋友在等他看电影”。
  • 当小明时间合适的时候,就要开始处理了。处理的方式有三种:1. 执行默认动作(马上去看电影) 2.执行自定义动作(打电话和女朋友说改成逛街)3.忽略(忽略和女朋友看电影,继续改bug。。)
  • 女朋友电话来的整个过程,对小明来说是异步的,小明不能准确断定女朋友什么时候给他打电话。

进程间的信号

  • 信号是进程之间事件异步通知的一种方式,属于软中断。
  • 和上面举的例子一样,信号处理动作有以下三种
  1. 忽略此信号。
  2. 执行该信号的默认处理动作
  3. 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。
  • 注意:进程在收到信号时并不是立即处理,而是在合适的时候处理

信号的产生

  • 使用 kill -l 命令查看系统定义的信号列表
    【Linux】进程信号

1.通过终端按键产生信号(键盘)

在程序运行时在键盘上按下Ctrl + c,向此进程发送SIGINT信号(即2号信号)。

SIGINT的默认处理动作是终止进程,SIGQUIT(即3号信号,键盘Ctrl + \)的默认处理动作是终止进程并且Core Dump
【Linux】进程信号
使用signal函数可以进行信号捕捉,signal(需要进行操作的信号,操作方式)
常见的操作方式是:
signal(2, handler) 对2号信号执行自定义操作(handler函数为用户自定义行为函数)
signal(2, SIG_IGN) 对2号信号执行忽略操作
signal(2, SIG_DFL) 对2号信号执行默认操作(终止进程)

自定义操作示例:
#include <stdio.h>
#include <signal.h>
#include <unistd.h>

void handler(int signo)
{
  printf("catch sig, signo : %d\n", signo);
}

int main()
{
  signal(2, handler); // 对2号信号执行handler自定义操作
  while(1)
  {
    printf("I am a process ... !\n");
    sleep(1);
  }
  return 0;
}

此时键盘输入 Ctrl+c 向进程发送2号信号,进程不会执行默认的终止动作,而执行用户的自定义动作
输入 Ctrl+\ 结束进程
【Linux】进程信号
是否所有信号的动作都能被修改?
测试代码:

#include <stdio.h>
#include <signal.h>
#include <unistd.h>

void handler(int signo)
{
  printf("catch sig, signo : %d\n", signo);
  exit(1);
}

int main()
{
  int i = 1;
  while(i <= 31)
  {
    signal(i, handler); // 捕捉1-31号信号,并修改信号的默认行为
    i++;
  }
  while(1)
  {
    printf("I am a process ... !\n");
    sleep(1);
  }
  return 0;
}

【Linux】进程信号
【Linux】进程信号
测试结果说明了 9号 信号不能被捕捉,进程在接收到9号信号后退出。

原因分析:操作系统防止有恶意程序屏蔽信号,导致程序无法退出,所以设置了无法捕捉的 9 号信号

2.调用系统函数向进程发信号

kill函数

#include <signal.h>
int kill(pid_t pid, int signo);
int raise(int signo);
这两个函数都是成功返回0,错误返回-1。
pid是进程id
signo是信号码

模拟实现kill命令

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <signal.h>
#include <stdlib.h>

// kill 9 1234
int main(int argc, char* argv[])
{
  if(argc != 3)
  {
    printf("Usage : %s sig pid\n", argv[0]);
    return 1;
  }

  int sig = atoi(argv[1]);
  int pid = atoi(argv[2]);

  kill(pid, sig); // 系统调用函数
}

通过执行 ./kill 4648 9 可以达到和 kill -9 4846 一样的效果
【Linux】进程信号

3.由软件条件产生信号

由软件条件产生的信号主要有SIGPIPE和SIGALRM信号

SIGPIPE是一种由软件条件产生的信号,在“管道”中已经介绍过了。
SIGALRM信号由alarm函数产生

#include <unistd.h>
unsigned int alarm(unsigned int seconds);
调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 该信号的默认处理动作是终止当前进程。

使用示例:

#include <stdio.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>

int count = 0;

void handler(int signo)
{
  printf("catch sig, signo : %d, count : %d\n", signo, count);
  exit(1);
}

int main()
{
  signal(SIGALRM, handler);
  alarm(1);
  while(1)
  {
    count++;
  }
  return 0;
}

程序功能:1秒钟之内不停地数数,1秒钟到了就被SIGALRM信号终止
【Linux】进程信号

4.硬件异常产生信号

硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释 为SIGFPE信号发送给进程。再比如当前进程访问了非法内存地址,MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。

模拟除0异常

#include <stdio.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>

int count = 0;

void handler(int signo)
{
  printf("catch sig, signo : %d, count : %d\n", signo, count);
  exit(1);
}

int main()
{
  int i = 1;
  while(i <= 31)
  {
    signal(i++, handler);
  }
  sleep(3);
  int a = 10;
  a /= 0;
  while(1);

  return 0;
}

【Linux】进程信号
由此可以确认,我们在C/C++当中除零,内存越界等异常,在系统层面上,是被当成信号处理的。

Core Dump

  • 首先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部 保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug(事后调试)。
  • 一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存 在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。
  • 在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。 首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K: $ ulimit -c 1024
#include <stdio.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>

int count = 0;

int main()
{
  sleep(3);
  int a = 10;
  a /= 0;
  while(1);

  return 0;
}

运行此代码,产生了core dump,但却没有core文件
【Linux】进程信号
原因是Linux默认禁用core,因为程序一旦崩溃就会生成一个core文件;而服务器挂了,人工启动服务器太慢,一般在服务器端用软件启动,如果服务器一直崩溃,一直重启,很快core dump会写满磁盘。

使用ulimit -a命令查看core file size0
【Linux】进程信号
运行ulimit -c 1024 启动Core文件并设置大小为1024K

运行除0程序

【Linux】进程信号
发现每次出现异常都会产生一个core文件

core文件可以用来调试

运行编译命令:gcc myprocess1.c -o myprocess1 -g

使用gdb调试,并加载core文件
【Linux】进程信号
gdb会在程序出错位置停下

总结

  • 所有信号产生,最终都要由操作系统来进行执行,因为操作系统是进程的管理者
  • 信号的处理不是立即处理的,而是在合适的时候
  • 信号不是被立即处理,那么信号需要暂时被进程记录下来,记录在进程地址空间的一个位图中(无符号整型)
  • 一个进程在没有收到信号的时候,知道自己应该对合法信号作何处理
  • 操作系统向进程发信号,实际上是向进程写信号,修改进程PCB里面的那个位图的对应比特位

阻塞信号

  • 实际执行信号的处理动作称为信号递达(Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(Pending)。
  • 进程可以选择阻塞 (Block )某个信号。
  • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
  • 注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

信号在内核中的表示

【Linux】进程信号

  • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。
  • 在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
  • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
  • SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。

信号集操作函数

#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
  • 函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
  • 函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置位,表示 该信号集的有效信号包括系统支持的所有信号。
  • 注意,在使用sigset_ t类型的变量之前,一定要调 用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
  • 这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种 信号,若包含则返回1,不包含则返回0,出错返回-1。
#include <stdio.h>
#include <signal.h>
#include <stdlib.h>
#include <unistd.h>

void show(sigset_t *pending)
{
  int i = 1;
  for(; i <= 31; i++)
  {
    if(sigismember(pending, i))
    {
      printf("1");
    }
    else 
    {
      printf("0");
    }
  }
  printf("\n");
}

void handler(int sig)
{
  printf("handler : %d\n", sig);
}

int main()
{
  signal(2, handler);

  sigset_t set, oset;
  sigemptyset(&set);
  sigemptyset(&oset);

  sigaddset(&set, 2);
  sigprocmask(SIG_SETMASK, &set, &set);

  int count = 10;
  while(1)
  {
    sigset_t pending;
    sigemptyset(&pending);
    sigpending(&pending);
    show(&pending);
    sleep(1);
    if(count-- <= 0)
    {
      printf("recover signal!\n");
      sigprocmask(SIG_SETMASK, &oset, NULL);
    }
  }
  return 0;
}

【Linux】进程信号

信号捕捉

【Linux】进程信号

内核(操作系统)返回到用户时进行信号处理

首先状态:用户->内核
由于操作系统不相信任何人,不执行用户代码,如果动作是自定义捕捉,则要切换成用户状态执行自定义代码后再返回内核。