一文搞懂Linux信号【下】

07-17 884阅读

目录

🚩引言

🚩阻塞信号

🚩信号保存

🚩信号捕捉 

🚩操作信号集

1.信号集操作函数

2.其它操作函数

🚩总结:


🚩引言

在观看本博客之前,建议大家先看一文搞懂Linux信号【上】。由于上一篇博客篇幅太长,为了更好的阅读体验,我拆成了两篇博客。那么接下来,在上一篇的基础上,我们继续学习Linux信号部分。本篇我们主要谈论信号保存和信号处理。

一文搞懂Linux信号【下】

🚩阻塞信号

🌸信号的其他几个相关的概念

首先,先向大家抛出信号中的几个概念

  • 实际执行信号的处理动作称为信号递达(Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(Pending)。
  • 进程可以选择阻塞 (Block )某个信号,
  • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
  • 注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

     张三在上小学时,非常讨厌数学老师,但是数学老师又很凶。有一次上课时,老师说:“拿起本子记一下作业”。尽管很不喜欢这个老师,但又很害怕这几老师,张三无奈的记下了作业,想着:我现在先不写,假如老师真的发现我没写作业的话,我再写。而相比于懦弱的张三,头铁的李四则选择压根不写,忽略这次信号。

    在这里,信号就像是作业。张三选择先记下作业,这就像是阻塞信号,等到什么时候被发现了,才写,写作业的过程,就是信号递达的过程。而李四的行为就是兑现好做出了处理,这个处理就是忽略。

    阻塞和忽略是两个不同的概念:

    阻塞信号是指在信号还未到来之前,先对某个信号阻塞,等到阻塞解除,才对信号做出处理动作。

    忽略:忽略本身就信号的处理动作,只不过这个处理动作是忽略。

    🚩信号保存

    🚀pending位图

    我们再一文搞懂Linux信号【上】中说过:信号在内核中是以unsigned int类型的位图来保存的,从低位到高位,比特位的位置代表信号的编号,比特位的内容代表是否收到对应的信号,0代表没有收到,1代表收到了对应的信号。这个位图就叫做pending位图。

    所以:发送信号的本质就是修改pending位图。与其说发送信号,不如说是写信号。由于pending位图在task_struct结构体中,属于内核数据结构,所以修改位图的结构只能是操作系统。

    🚀block位图

    在操作系统,还有一个位图结构,叫作lock位图。

    在block位图中,比特位的位置代表对应的信号的编号。对应的比特位为0,代表该信号没有被阻塞,可以递达;对应的比特位为1,代表该信号被阻塞,无法递达,除非解除阻塞。

    所以,一个信号要想递达,①要将pending位图中对应的比特位置为1,②要将block位图中对应的比特位置为0。

    🚀hander数组

    一文搞懂Linux信号【下】

    在进程的task_struct结构体中,存在着一个存放sighander_t*类型的指针数组。在这个数组中,数组的位置代表信号的编号, 数组下标的内容,代表对应信号的处理方法(自定义行为)。当上层调用signal设置自定义行为时,操作系统会将自定义函数的地址传入该数组中,然后对信号进行捕捉时,通过数组中的地址找到对应的处理方法,完成捕捉。

    如图:

    一文搞懂Linux信号【下】

     针对如上的三个结构,需要说明的有:

    1. 一个信号没有被发送,并不影响这个信号被阻塞。
    2. 我们刚开始学习信号时,知道操作系统认识对应的信号是通过程序员的编码完成的。现在我们知道每一个信号的相关信息都会被设置进3个结果中,等到信号来临时,就可以做出处理动作。
    3. 由于信号是用位图来保存的,所以,当操作系统连续多次向某个进程发送大量同种信号时,pending位图也只能记录一次。其他信号也就会丢失。

    🚩信号捕捉 

     从刚一开始接触信号时,我们就说:信号在产生的时候,不会被立即处理,而是要等到合适的时候再进行处理。什么是合适的时候呢?在进程从内核态返回用户态的时候,也就代表着曾经我一定进入过内核态。为了方便讲解,我们先补充一些预备知识。

     🚀用户态和内核态

    一文搞懂Linux信号【下】

    如图所示

    代码的运行状态分为两种:用户态和内核态,用户态是最基本的运行状态,自己所写的代码全部都是用户态的代码,内核态则比较高级。

    当代码中出现①使用操作系统的自身资源(getpid,waitpid.......)②涉及访问硬件资源(printf,scanf.......)时。用户为了访问这些资源,必须直接或者间接的使用操作系统提供的系统调用接口。但是普通用户无法直接调用系统调用接口,必须让自己的身份从用户态变为内核态。实际执行系统调用的进程,但是身份其实是内核。这里,还要说明一点:因为从用户态访问内核资源还要发生身份的变化,成本较高,所以往往系统调用比较浪费时间,所以尽量不要频繁的调用系统调用接口。

    🚩cpu和寄存器

    对于cpu大家都不陌生,负责数据的运算。在cpu中有大量的寄存器,这些寄存器分为可见寄存器和不可见寄存器。其中很多寄存器都和进程是强相关的,保存着进程的上下文数据。寄存器属于操作系统,但寄存器内的数据属于进程。当一个进程在cpu上运行时,有关该进程的数据都被投递到寄存器中。典型的比如:①当前进程的task_struct地址②页表的起始地址(方便虚拟内存和物理内存之间的转化)都被投递到不同的寄存器中。

    其中,有一个名为CR3的寄存器,这个寄存器表征当前进程是处于用户态还是内核态。寄存器内的数字为0表示处于内核态,数字为3表示处于用户态。

    🚀深挖虚拟内存空间

    我们之前在将虚拟内存时,知道虚拟内存一共有4G的空间,其中3G的空间是用户空间,该块空间通过页表和物理内存映射,进而读取用户代码和数据。但是还存在1G的内核空间呢?这是什么鬼?干什么用的?

    这块空间同样通过页表和物理内存形成映射,只不过想映射的物理内存中存储的不再是用户的代码和数据,而是操作系统和系统调用的相关代码数据和方法。

    用户空间和内核空间的页表等等有什么不同呢?

    • 用户空间属于该进程的空间,具有私密性,同时每个进程都有相对应的用户空间页表结构,且不同进程的用户级页表不同。
    • 在操作系统启动时,操作系统的相关的代码和数据加载到对应的物理内存,由于操作系统只有一个,所以所有的进程共享一个内核级页表,不具有私密性。

      一文搞懂Linux信号【下】 

      所以,如果进程想要访问操作系统的资源,该如何做?

      1. 将CPU中的CR3寄存器储存的值由3变为0
      2. 在进程地址空间中,在空间的上下文之间进行跳转。由用户级空间跳转到内核级空间,通过内核级页表映射,找到系统调用的执行方法。

      所以,我们知道从用户态和内核态之间的跳转是非常浪费资源的。当代码执行到需要访问操作系统资源的时候,尽管浪费资源和时间,但是进程还要从用户态变为内核态,然后执行相关的系统调用接口。但是,站在进程的角度,它认为跳转一次太慢了,必须把所有只能在内核态中才能进行的操作完成。进程从用户态切换成内核态常见的原因有:系统调用,进程切换。

      因为处理信号也需要在内核态中进行。所以进程就开始检查信号对应的block位图和pending位图。

       检查顺序为先查block位图,然后再查pending位图。我展开说一下:

      1. 首先,查block位图。如果比特位为1,表示被阻塞,然后接着下一位比特位;如果比特位为0,再看pending中该信号对应的比特位,如果为0,接着查block位图的下一位比特位;如果比特位为1,说明该信号目前处于未决状态,应立即处理。然后查对应的处理方法hander表。

      但是如果这个信号对应的处理方法是自定义行为呢?自定义函数属于自己编写的代码,在用户态中,操作系统允许进程在内核态中运行用户态的代码吗?

      不行。理论上可以,但是操作系统为了安全,不敢这么干。因为它并不知道这个方法要干什么,万一要是恶意者恶搞系统咋办,所以,操作系统能力让进程在内核态中执行用户态的代码,但是不敢这么做。如果进程处于用户态然后执行这个方法,操作系统就没必要担心了,出了事也是这个进程被终止,和操作系统没关系。,

      所以,为了执行信号的自定义方法,进程必须从内核态中返回用户态

      当执行完方法后,如果有需要,进程还要返回内核态中,继续运行程序。

      总结一下:

      一文搞懂Linux信号【下】

      我们看到,其实整个过程看起来就像是个躺着的8。我把整个过程分为4个小过程,逐一说明

      ①代码在执行过程中遇到了系统调用或者时间片已到要进行程序替换。进程从用户态变为内核态来执行该过程。

      ②执行完毕。由于进程状态切换太浪费资源,进程就像一次性把要在内核态中干的所有事情全部搞完,再返回内核态。所以就检测是否收到了信号,如果收到了信号,并且处理方法是自定义方法,在用户态对应的物理内存。

      ③进程为了执行信号的处理方法,返回用户态执行。执行完毕后,返回内核态继续干其他工作。

      ④当进程把所有只能在内核态中运行的操作,全部完成后,返回用户态执行。 

      🚩操作信号集

       我们的信号位图又称信号集,分为pending信号集和block信号集。block信号集又称信号屏蔽字。

      1.信号集操作函数

      #include 
      int sigemptyset(sigset_t *set);
      int sigfillset(sigset_t *set);
      int sigaddset (sigset_t *set, int signo);
      int sigdelset(sigset_t *set, int signo);
      int sigismember(const sigset_t *set, int signo); 
      
      • 函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含 任何有效信号。
      • 函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置1,表示该信号集的有效信号包括系统支持的所有信号。
      • 在使用sigset_ t类型的变量之前,一定要调用sigemptyset 或sigfillset 做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
      • 这四个函数都是成功返回0,出错返回-1。
      • sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。

        2.其它操作函数

        调用函数sigprocmask可以读取或更改进程的信号屏蔽字(block)。

        #include 
        int sigprocmask(int how, const sigset_t *set, sigset_t *oset); 
        返回值:若成功则为0,若出错则为-1 
        

         如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则 更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。

        SIG_BLOCK:将set指向信号集中的信号,添加到进程阻塞信号集;

        SIG_UNBLOCK:将set指向信号集中的信号,从进程阻塞信号集删除;

        SIG_SETMASK:将set指向信号集中的信号,设置成进程阻塞信号集;

        调用函数sigpending可以读取当前进程的未决信号集,

        #include 
        int sigpending(sigset_t *set);
        

        现在我们用上述函数来测试一下信号递达的过程:首先是对SIGINT信号进行阻塞,然后通过ctrl+c 发送SIGINT 信号,发现SIGINT信号在pending位图中别标记为1,但是信号未决,直到解除对SIGINT信号的屏蔽,SIGINT信号递达,后续再发送SIGINT信号,会被直接递达,因为ISGINT并没有被阻塞。

        #include
        #include
        #include
        #include
        #include
        #define NUM 32
        using namespace std;
        vectorsigarr={2};
        // 打印信号集
        static void show_pending(const sigset_t &s)
        {
            for(int signo=32;signo>=1;signo--)
            {
                if(sigismember(&s,signo))
                {
                    cout
VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]