2015 June 04 linux,signal

信号处理的时机

我们知道1-32是最早就拥有的信号，之后又加入了33~64信号。编号为33-64的信号又称为实时信号。需要注意的是：这里的“实时”和实时操作系统中的“实时”没有任何联系，实时信号在处理速度上并不会比普通信号快，它们之间的区别就是：普通信号会对多次的同一个信号进行“合并”处理，而实时信号会一一处理。这就要求我们在编写信号监听函数时，要捕获普通信号，必须时刻轮训监听，因为系统默认会丢弃同种类型的普通信号！

在用户态下，我们向一个进程发送信号，但是这个信号如何被处理呢？其实信号处理的时机就是从异常或中断恢复发生时处理，这里我们可以把中断理解为1）中断 2）system call 两个时机，这两个时机都会有从内核态->用户态切换的过程。

根据ULK中kernel返回用户态的流程图:

我们发现当kernel 从中断异常返回时,会检查USER_RPL决定返回 kernel 还是 userspace，当跳入到resume_userspace，也就意味着在返回用户空间时，检查_TIF_WORK_MASK 是否有信号，如果没有则返回restore_all，否则进入work_pending，其实这里就可以看到信号处理是一个异步的！


ret_from_exception:
    preempt_stop(CLBR_ANY)
ret_from_intr:
    GET_THREAD_INFO(%ebp)
#ifdef CONFIG_VM86
...
#else
    /*
     * We can be coming here from child spawned by kernel_thread().
     */
    movl PT_CS(%esp), %eax
    andl $SEGMENT_RPL_MASK, %eax
#endif
    cmpl $USER_RPL, %eax
    jb resume_kernel        # not returning to v8086 or userspace
 
ENTRY(resume_userspace)
    LOCKDEP_SYS_EXIT
    DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
                    # setting need_resched or sigpending
                    # between sampling and the iret
    TRACE_IRQS_OFF
    movl TI_flags(%ebp), %ecx
    andl $_TIF_WORK_MASK, %ecx  # is there any work to be done on
                    # int/exception return?
    jne work_pending
    jmp restore_all
END(ret_from_exception)

如果返回是kernel的话，按照汇编代码与图示，要先禁中断，然后判断__preempt_count变量值，当出现中断嵌套这个值会+1,如果为0也就意味着当前系统没有出现中断的嵌套执行restore_all，否则然后查看X86EFLAGS_IF是否是禁止屏蔽中断，如果屏蔽中断然后执行restore_all，否则调用preempt_schedule_irq，然后处理信号。直到__preempt_count==0，跳出这个循环。（Linux中的信号机制优先级是：高优先级中断->低优先级中断->软中断->信号->进程运行。）


#ifdef CONFIG_PREEMPT
ENTRY(resume_kernel)
    DISABLE_INTERRUPTS(CLBR_ANY)
need_resched:
    cmpl $0,PER_CPU_VAR(__preempt_count)
    jnz restore_all
    testl $X86_EFLAGS_IF,PT_EFLAGS(%esp)    # interrupts off (exception path) ?
    jz restore_all
    call preempt_schedule_irq
    jmp need_resched
END(resume_kernel)
#endif
    CFI_ENDPROC
...

这里我们进入到work_pending函数段，系统会进行调度，work_resched是个循环，一直在调度schedule，直到跳出循环。在这个汇编的末尾，kernel会判断$USER_RPL 值决定是返回kernel space还是user space，如果返回user space才会调用do_notify_resume()函数，这个函数是处理信号，调用do_signal（）的基础，这个也从侧面反映了内核空间没有信号处理机制！


work_pending:
    testb $_TIF_NEED_RESCHED, %cl
    jz work_notifysig
work_resched:
...
work_notifysig:             # deal with pending signals and
                    # notify-resume requests
#ifdef CONFIG_VM86
...
#else
    movl %esp, %eax
#endif
    TRACE_IRQS_ON
    ENABLE_INTERRUPTS(CLBR_NONE)
    movb PT_CS(%esp), %bl
    andb $SEGMENT_RPL_MASK, %bl
    cmpb $USER_RPL, %bl
    jb resume_kernel
    xorl %edx, %edx
    call do_notify_resume
    jmp resume_userspace

我们进入到do_notify_resume()函数，这个函数会调用do_signal,它就是处理系统调用或者中断发生信号的核心函数，这个函数又依次处理信号（通过调用handle_signal()）和建立用户态堆栈(通过调用setup_frame()或setup_rt_frame())。当进程又切换到用户态时，因为信号处理程序的起始地址被强制放进程序计数器中，因此开始执行信号处理程序。


__visible void
do_notify_resume(struct pt_regs *regs, void *unused, __u32 thread_info_flags)
{
...
    /* deal with pending signal delivery */
    if (thread_info_flags & _TIF_SIGPENDING)
        do_signal(regs);
...
}

当处理程序终止时，setup_frame()或setup_rt_frame()函数(这里的rt代表实时系统中的rt结构。)放在用户态堆栈中的返回代码就被执行。这个代码调用sigreturn()或rt_sigrenturn()系统调用，相应的服务例程把正常程序的用户态堆栈硬件上下文拷贝到内核堆栈，并把用户态堆栈恢复到它原来的状态(通过调用restore_sigcongtext()).当这个系统调用结束时，普通进程就因此能恢复自己的执行。

所以综上所述：

如果我们自定义一个信号处理函数，那么这个处理函数定义在用户空间，1. 在进入内核态时，内核态堆栈中保存了一个中断现场，也就是一个pt_regs结构，中断返回地址就保存在pt_regts中的pc中，因此我们这里只要把当前进程的pt_regs中pc设置为sa_handler，然后返回到用户态就开始从sa_handler处开始执行了。

2.当信号的用户态处理函数执行结束时，需要再次进入内核态，内核专门提供了一个系统调用sys_sigreturn()(还有一个sys_rt_sigreturn())

3.在构建临时堆栈环境时，内核会把最初的pt_regs上下文备份到临时堆栈中(位于用户态堆栈)，当通过系统调用sys_sigreturn()再次进入内核时，内核从用户态空间还原出原始的pt_regs。最后正常返回。

这里我们要考虑一种情况，进程处于TASK_INTERRUPTIBLE状态，某个进程向他发送一个信号，这时kernel将这个进程立即设置为TASK_RUNNING状态，但是系统宾没有完成当前的服务例程，并返回EINTR错误码，我们可以测试这个错误码，并重行发送新的system call，还有一些错误码用来判断kernel是否重行执行system call。

##参考：

ULK P445～P446

http://wangyuxxx.iteye.com/blog/1703252

http://blog.csdn.net/ce123_zhouwei/article/details/8570616