详解wait和waitpid函数

#include <sys/types.h> /* 提供类型pid_t的定义 */
#include <sys/wait.h>
pid_t wait(int *status)
进程一旦调用了wait,就当即阻塞本身,由wait自动分析是否当前进程的某个子进程已经退出,若是让它找到了这样一个已经变成僵尸的子进程,wait就会收集这个子进程的信息,并把它完全销毁后返回;若是没有找到这样一个子进程,wait就会一直阻塞在这里,直到有一个出现为止。
参数status用来保存被收集进程退出时的一些状态,它是一个指向int类型的指针。但若是咱们对这个子进程是如何死掉的绝不在乎,只想把这个僵尸进程消灭掉,(事实上绝大多数状况下,咱们都会这样想),咱们就能够设定这个参数为NULL,就象下面这样:
pid = wait(NULL);
若是成功,wait会返回被收集的子进程的进程ID,若是调用进程没有子进程,调用就会失败,此时wait返回-1,同时errno被置为ECHILD。
wait调用例程:
/* wait1.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdlib.h>
main()
{
        pid_t pc,pr;
        pc=fork();
 
        if(pc<0) /* 若是出错 */
               printf("error ocurred!/n");
       else if(pc==0){ /* 若是是子进程 */
               printf("This is child process with pid of %d/n",getpid());
              sleep(10); /* 睡眠10秒钟 */
            }
        else{ /* 若是是父进程 */
               pr=wait(NULL); /* 在这里等待 */
              printf("I catched a child process with pid of %d/n"),pr);
        }
       exit(0);
}
编译并运行:
$ gcc wait1.c -o wait1
$ ./wait1
This is child process with pid of 1508
I catched a child process with pid of 1508
能够明显注意到,在第2行结果打印出来前有10 秒钟的等待时间,这就是咱们设定的让子进程睡眠的时间,只有子进程从睡眠中苏醒过来,它才能正常退出,也就才能被父进程捕捉到。其实这里咱们无论设定子进程睡眠的时间有多长,父进程都会一直等待下去,读者若是有兴趣的话,能够试着本身修改一下这个数值,看看会出现怎样的结果。
参数status:
若是参数status的值不是NULL,wait就会把子进程退出时的状态取出并存入其中,这是一个整数值(int),指出了子进程是正常退出仍是被非正常结束的(一个进程也能够被其余进程用信号结束,咱们将在之后的文章中介绍),以及正常结束时的返回值,或被哪个信号结束的等信息。因为这些信息被存放在一个整数的不一样二进制位中,因此用常规的方法读取会很是麻烦,人们就设计了一套专门的宏(macro)来完成这项工做,下面咱们来学习一下其中最经常使用的两个:
1、WIFEXITED(status) 这个宏用来指出子进程是否为正常退出的,若是是,它会返回一个非零值(请注意,虽然名字同样,这里的参数status并不一样于wait惟一的参数---指向整数的指针status,而是那个指针所指向的整数,切记不要搞混了)
2、WEXITSTATUS(status) 当WIFEXITED返回非零值时,咱们能够用这个宏来提取子进程的返回值,若是子进程调用exit(5)退出,WEXITSTATUS(status) 就会返回5;若是子进程调用exit(7),WEXITSTATUS(status)就会返回7。请注意,若是进程不是正常退出的,也就是说, WIFEXITED返回0,这个值就毫无心义。
下面经过例子来实战一下咱们刚刚学到的内容:
/* wait2.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
main()
{
       int status;
       pid_t pc,pr;
       
        pc=fork();
        if(pc<0) /* 若是出错 */
               printf("error ocurred!/n");
        else if(pc==0){ /* 子进程 */
               printf("This is child process with pid of %d./n",getpid());
               exit(3); /* 子进程返回3 */
        }
        else{ /* 父进程 */
               pr=wait(&status);
               if(WIFEXITED(status)){ /* 若是WIFEXITED返回非零值 */
                       printf("the child process %d exit normally./n",pr);
                       printf("the return code is %d./n",WEXITSTATUS(status));
               }else /* 若是WIFEXITED返回零 */
                   printf("the child process %d exit abnormally./n",pr);
        }
}
编译并运行:
$ gcc wait2.c -o wait2
$ ./wait2
This is child process with pid of 1538.
the child process 1538 exit normally.
the return code is 3.
父进程准确捕捉到了子进程的返回值3,并把它打印了出来。
固然,处理进程退出状态的宏并不止这两个,但它们当中的绝大部分在平时的编程中不多用到,就也不在这里浪费篇幅介绍了,有兴趣的读者能够本身参阅Linux man pages去了解它们的用法。
进程同步:
有时候,父进程要求子进程的运算结果进行下一步的运算,或者子进程的功能是为父进程提供了下一步执行的先决条件(如:子进程创建文件,而父进程写入数据),此时父进程就必须在某一个位置停下来,等待子进程运行结束,而若是父进程不等待而直接执行下去的话,能够想见,会出现极大的混乱。这种状况称为进程之间的同步,更准确地说,这是进程同步的一种特例。进程同步就是要协调好2个以上的进程,使之以安排好地次序依次执行。解决进程同步问题有更通用的方法,咱们将在之后介绍,但对于咱们假设的这种状况,则彻底能够用wait系统调用简单的予以解决。请看下面这段程序:
#include <sys/types.h>
#include <sys/wait.h>
main()
{
        pid_t pc, pr;
        int status;
 
        pc=fork();
 
       if(pc<0)
               printf("Error occured on forking./n");
        else if(pc==0){
                /* 子进程的工做 */
                exit(0);
        }else{
               /* 父进程的工做 */
               pr=wait(&status);
              /* 利用子进程的结果 */
        }
}
这段程序只是个例子,不能真正拿来执行,但它却说明了一些问题,首先,当fork调用成功后,父子进程各作各的事情,但当父进程的工做告一段落,须要用到子进程的结果时,它就停下来调用wait,一直等到子进程运行结束,而后利用子进程的结果继续执行,这样就圆满地解决了咱们提出的进程同步问题。
waitpid系统调用在Linux函数库中的原型是:
#include <sys/types.h> /* 提供类型pid_t的定义 */
#include <sys/wait.h>
pid_t waitpid(pid_t pid,int *status,int options)
从本质上讲,系统调用waitpid和wait的做用是彻底相同的,但waitpid多出了两个可由用户控制的参数pid和options,从而为咱们编程提供了另外一种更灵活的方式。下面咱们就来详细介绍一下这两个参数:
pid:从参数的名字pid和类型pid_t中就能够看出,这里须要的是一个进程ID。但当pid取不一样的值时,在这里有不一样的意义。
         pid>0时,只等待进程ID等于pid的子进程,无论其它已经有多少子进程运行结束退出了,只要指定的子进程尚未结束,waitpid就会一直等下去。
         pid=-1时,等待任何一个子进程退出,没有任何限制,此时waitpid和wait的做用如出一辙。
         pid=0时,等待同一个进程组中的任何子进程,若是子进程已经加入了别的进程组,waitpid不会对它作任何理睬。
         pid<-1时,等待一个指定进程组中的任何子进程,这个进程组的ID等于pid的绝对值。
options:options提供了一些额外的选项来控制waitpid,目前在Linux中只支持WNOHANG和WUNTRACED两个选项,这是两个常数,能够用"|"运算符把它们链接起来使用,好比:
ret=waitpid(-1,NULL,WNOHANG | WUNTRACED);
若是咱们不想使用它们,也能够把options设为0,如:
ret=waitpid(-1,NULL,0);
若是使用了WNOHANG参数调用waitpid,即便没有子进程退出,它也会当即返回,不会像wait那样永远等下去。
而WUNTRACED参数,因为涉及到一些跟踪调试方面的知识,加之极少用到,这里就很少费笔墨了,有兴趣的读者能够自行查阅相关材料。
看到这里,聪明的读者可能已经看出端倪了:wait不就是通过包装的waitpid吗?没错,察看<内核源码目录>/include/unistd.h文件349-352行就会发现如下程序段:
static inline pid_t wait(int * wait_stat)
{
    return waitpid(-1,wait_stat,0);
}
返回值和错误
waitpid的返回值比wait稍微复杂一些,一共有3种状况:
          1、当正常返回的时候,waitpid返回收集到的子进程的进程ID;
          2、若是设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;
          3、若是调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
当pid所指示的子进程不存在,或此进程存在,但不是调用进程的子进程,waitpid就会出错返回,这时errno被设置为ECHILD;
/* waitpid.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
main()
{
        pid_t pc, pr;
 
        pc=fork();
        if(pc<0) /* 若是fork出错 */
               printf("Error occured on forking./n");
        else if(pc==0){ /* 若是是子进程 */
               sleep(10); /* 睡眠10秒 */
              exit(0);
        }
        /* 若是是父进程 */
       do{
               pr=waitpid(pc, NULL, WNOHANG); /* 使用了WNOHANG参数,waitpid不会在这里等待 */
               if(pr==0){ /* 若是没有收集到子进程 */
                  printf("No child exited/n");
                   sleep(1);
               }
        }while(pr==0); /* 没有收集到子进程,就回去继续尝试 */
        if(pr==pc)
               printf("successfully get child %d/n", pr);
        else
               printf("some error occured/n");
}
编译并运行:
$ cc waitpid.c -o waitpid
$ ./waitpid
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
successfully get child 1526
父进程通过10次失败的尝试以后,终于收集到了退出的子进程。
由于这只是一个例子程序,不便写得太复杂,因此咱们就让父进程和子进程分别睡眠了10秒钟和1秒钟,表明它们分别做了10秒钟和1秒钟的工做。父子进程都有工做要作,父进程利用工做的简短间歇察看子进程的是否退出,如退出就收集它。
提示:能够尝试在最后一个例子中把pr=waitpid(pc, NULL, WNOHANG); 改成pr=waitpid(pc, NULL, 0);或者pr=wait(NULL);看看运行结果有何变化?(修改后的结果使得父进程将本身阻塞,直到有子进程退出为止!)
相关文章
相关标签/搜索