欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

时序竟态条件分析 sigsuspend函数 Linu系统编程

程序员文章站 2022-06-24 20:35:27
...

简单的自定义sleep函数

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<fcntl.h>
#include<sys/types.h>
#include<signal.h>
#include<errno.h>
void cat_sig(int sig)
{
    ;
}
unsigned int mysleep(unsigned int seconds)
{
    int ret;
    struct sigaction act,oldact;
    act.sa_handler=cat_sig;
    sigemptyset(&act.sa_mask);
    act.sa_flags=0;

    ret=sigaction(SIGALRM,&act,&oldact);//注册捕捉信号,防止进程退出
    if(ret==-1)
    {
        perror("sigaction error!");
        exit(1);
    }
    alarm(seconds);
    ret=pause();  //主动挂起,等待信号
    if(ret==-1&&errno==EINTR)
    {
        printf("pause success!\n");
    }
    ret=alarm(0);//闹钟清零
    sigaction(SIGALRM,&oldact,NULL);//恢复SIGALRM原有的处理方式。
    return ret;
}


int main()
{
    while(1)
    {
        mysleep(3);
        printf("----------\n");
    }
    return 0;
}

时序竟态产生原因
以上程序中如果在pause()之前alarm计数没满的时候失去了CPU资源,当CPU资源重新回到这个进程上时,3秒已经过去了,SIGALRM信号已经处于递达态,CPU肯定会优先处理该信号的,这个信号处理之后,再来执行pause函数(注意,此时信号已经从未决状态释放,处于递达状态),pause之后进程等待信号唤醒,可是现在信号都没有,它就不会醒了。
对于这个小的测试程序来说出现这种状况的情况可以说是微乎其微,但如果是Linux服务器的一个核心程序,虽然这种概率比较小,但是服务器那是跑起来就不停的,在上千万次的运行中,出现这样的事也不奇怪,这个程序一停,损失就非常大了。
现在使用sigsuspend函数来解决这个问题
原型:int sigsuspend(const sigset_t *mask); :挂起等待信号。sigsuspend函数调用期间,进程信号屏蔽字由其参数mask指定。

可将某个信号(如SIGALRM)从临时信号屏蔽字mask中删除,这样在调用sigsuspend时将解除对该信号的屏蔽,然后挂起等待,当sigsuspend返回时,进程的信号屏蔽字恢复为原来的值。如果原来该信号是屏蔽态,sigsuspend函数返回后仍然屏蔽该信号。

改进版的自定义mysleep函数

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<fcntl.h>
#include<sys/types.h>
#include<signal.h>


void catch_sig(int sig)
{
    ;//空函数
}
unsigned int mysleep(unsigned int sec)
{
    struct sigaction act,oldact;
    sigset_t newmask,oldmask,suspmask;
    unsigned int unslept;
    //1.为SIGALRM设置捕捉函数,一个空函数
    act.sa_handler=catch_sig;
    sigemptyset(&act.sa_mask);
    act.sa_flags=0;
    sigaction(SIGALRM,&act,&oldact);

    //2.设置阻塞信号集,阻塞SIGALRM信号
    sigemptyset(&newmask);
    sigaddset(&newmask,SIGALRM);
    sigprocmask(SIG_BLOCK,&newmask,&oldmask);

    //3.定时
    alarm(sec);
    
    //4.构造一个调用sigsuspend临时有效的阻塞信号集
    //在临时阻塞信号集里解除SIGALRM的阻塞
    suspmask=oldmask;               //把原有的信号集赋值给临时集
    sigdelset(&suspmask,SIGALRM);   //确保解除SIGALRM的阻塞,原有信号集可能已经设置了阻塞

    /*5.sigsuspend调用期间,采用临时阻塞集suspmask替换原有阻塞集
     *  这个信号集中不包含SIGALRM
     *  当sigsuspend被信号唤醒返回时,恢复原有的阻塞信号集*/
    sigsuspend(&suspmask);   //解除信号屏蔽和挂起等待信号合并为一个“原子操作”
    /*如果此函数之前进程失去cpu,计时已满足(自然计时),SIGALRM被屏蔽处于未决状态
     *执行此函数后,解除屏蔽,SIGALRM递达,执行捕捉函数同时进程被唤醒*/

     unslept=alarm(0);     //返回剩余时间
     //6.恢复SIGALRM原有的处理动作,mysleep作为第三方接口,在返回时应该还原相应状态
     sigaction(SIGALRM,&oldact,NULL);

     //7.解除对SIGALRM的阻塞,还原阻塞集
    sigprocmask(SIGALRM,&oldmask,NULL);

    return unslept;
}

int main()
{
    while(1)
    {
        mysleep(3);
        printf("------timeout--------\n");
    }
}

总结

时序问题分析

回顾,借助pause和alarm实现的mysleep函数。设想如下时序:

注册SIGALRM信号处理函数 (sigaction…)

调用alarm(3) 函数设定闹钟3秒。

函数调用刚结束,开始倒计时3秒。当前进程失去cpu,内核调度优先级高的进程(有多个)取代当前进程。当前进程无法获得cpu,进入就绪态等待cpu。

3秒后,闹钟超时,内核向当前进程发送SIGALRM信号(自然定时法,与进程状态无关),高优先级进程尚未执行完,当前进程仍处于就绪态,信号无法处理(未决)

优先级高的进程执行完,当前进程获得cpu资源,内核调度回当前进程执行。SIGALRM信号递达,信号设置捕捉,执行处理函数。

信号处理函数执行结束,返回当前进程主控流程,pause()被调用挂起等待。(欲等待alarm函数发送的SIGALRM信号将自己唤醒)

SIGALRM信号已经处理完毕,pause不会等到。

解决时序问题

可以通过设置屏蔽SIGALRM的方法来控制程序执行逻辑,但无论如何设置,程序都有可能在"解除信号屏蔽"与"挂起等待信号"这个两个操作间隙失去cpu资源。除非将这两步骤合并成一个"原子操作"。sigsuspend函数具备这个功能。在对时序要求严格的场合下都应该使用sigsuspend替换pause。

int sigsuspend(const sigset_t *mask); 挂起等待信号。

sigsuspend函数调用期间,进程信号屏蔽字由其参数mask指定。

可将某个信号(如SIGALRM)从临时信号屏蔽字mask中删除,这样在调用sigsuspend时将解除对该信号的屏蔽,然后挂起等待,当sigsuspend返回时,进程的信号屏蔽字恢复为原来的值。如果原来对该信号是屏蔽态,sigsuspend函数返回后仍然屏蔽该信号

总结

竞态条件,跟系统负载有很紧密的关系,体现出信号的不可靠性。系统负载越严重,信号不可靠性越强。

不可靠由其实现原理所致。信号是通过软件方式实现(跟内核调度高度依赖,延时性强),每次系统调用结束后,或中断处理处理结束后,需通过扫描PCB中的未决信号集,来判断是否应处理某个信号。当系统负载过重时,会出现时序混乱。

这种意外情况只能在编写程序过程中,提早预见,主动规避,而无法通过gdb程序调试等其他手段弥补。且由于该错误不具规律性,后期捕捉和重现十分困难。