exec函数簇

时间 2019-11-13

标签 exec 函数繁體版

原文原文链接

转自：http://www.cppblog.com/prayer/archive/2009/04/15/80077.htmlhtml

也许有很多读者从本系列文章一推出就开始读，一直到这里还有一个很大的疑惑：既然全部新进程都是由fork产生的，并且由fork产生的子进程和父进程几乎彻底同样，那岂不是意味着系统中全部的进程都应该如出一辙了吗？并且，就咱们的常识来讲，当咱们执行一个程序的时候，新产生的进程的内容应就是程序的内容才对。是咱们理解错了吗？显然不是，要解决这些疑惑，就必须提到咱们下面要介绍的exec系统调用。linux

1.10.1 简介编程

说是exec系统调用，实际上在Linux中，并不存在一个exec()的函数形式，exec指的是一组函数，一共有6个，分别是：数组

#include <unistd.h>
            int execl(const char *path, const char *arg, ...);
            int execlp(const char *file, const char *arg, ...);
            int execle(const char *path, const char *arg, ..., char *const envp[]);
            int execv(const char *path, char *const argv[]);
            int execvp(const char *file, char *const argv[]);
            int execve(const char *path, char *const argv[], char *const envp[]);

其中只有execve是真正意义上的系统调用，其它都是在此基础上通过包装的库函数。bash

exec函数族的做用是根据指定的文件名找到可执行文件，并用它来取代调用进程的内容，换句话说，就是在调用进程内部执行一个可执行文件。这里的可执行文件既能够是二进制文件，也能够是任何Linux下可执行的脚本文件。less

与通常状况不一样，exec函数族的函数执行成功后不会返回，由于调用进程的实体，包括代码段，数据段和堆栈等都已经被新的内容取代，只留下进程ID等一些表面上的信息仍保持原样，很有些神似"三十六计"中的"金蝉脱壳"。看上去仍是旧的躯壳，却已经注入了新的灵魂。只有调用失败了，它们才会返回一个-1，从原程序的调用点接着往下执行。dom

如今咱们应该明白了，Linux下是如何执行新程序的，每当有进程认为本身不能为系统和拥护作出任何贡献了，他就能够发挥最后一点余热，调用任何一个exec，让本身以新的面貌重生；或者，更广泛的状况是，若是一个进程想执行另外一个程序，它就能够fork出一个新进程，而后调用任何一个exec，这样看起来就好像经过执行应用程序而产生了一个新进程同样。函数

事实上第二种状况被应用得如此广泛，以致于Linux专门为其做了优化，咱们已经知道，fork会将调用进程的全部内容原封不动的拷贝到新产生的子进程中去，这些拷贝的动做很消耗时间，而若是fork完以后咱们立刻就调用exec，这些辛辛苦苦拷贝来的东西又会被马上抹掉，这看起来很是不划算，因而人们设计了一种"写时拷贝（copy-on-write）"技术，使得fork结束后并不马上复制父进程的内容，而是到了真正实用的时候才复制，这样若是下一条语句是exec，它就不会白白做无用功了，也就提升了效率。学习

1.10.2 稍稍深刻优化

上面6条函数看起来彷佛很复杂，但实际上不管是做用仍是用法都很是类似，只有很微小的差异。在学习它们以前，先来了解一下咱们习觉得常的main函数。

下面这个main函数的形式可能有些出乎咱们的意料：

int main(int argc, char *argv[], char *envp[])

它可能与绝大多数教科书上描述的都不同，但实际上，这才是main函数真正完整的形式。

参数argc指出了运行该程序时命令行参数的个数，数组argv存放了全部的命令行参数，数组envp存放了全部的环境变量。环境变量指的是一组值，从用户登陆后就一直存在，不少应用程序须要依靠它来肯定系统的一些细节，咱们最多见的环境变量是PATH，它指出了应到哪里去搜索应用程序，如/bin；HOME也是比较常见的环境变量，它指出了咱们在系统中的我的目录。环境变量通常以字符串"XXX=xxx"的形式存在，XXX表示变量名，xxx表示变量的值。

值得一提的是，argv数组和envp数组存放的都是指向字符串的指针，这两个数组都以一个NULL元素表示数组的结尾。

咱们能够经过如下这个程序来观看传到argc、argv和envp里的都是什么东西：

/* main.c */
            int main(int argc, char *argv[], char *envp[])
            {
            printf("\n### ARGC ###\n%d\n", argc);
            printf("\n### ARGV ###\n");
            while(*argv)
            printf("%s\n", *(argv++));
            printf("\n### ENVP ###\n");
            while(*envp)
            printf("%s\n", *(envp++));
            return 0;
            }

编译它：

$ cc main.c -o main

运行时，咱们故意加几个没有任何做用的命令行参数：

$ ./main -xx 000
            ### ARGC ###
            3
            ### ARGV ###
            ./main
            -xx
            000
            ### ENVP ###
            PWD=/home/lei
            REMOTEHOST=dt.laser.com
            HOSTNAME=localhost.localdomain
            QTDIR=/usr/lib/qt-2.3.1
            LESSOPEN=|/usr/bin/lesspipe.sh %s
            KDEDIR=/usr
            USER=lei
            LS_COLORS=
            MACHTYPE=i386-redhat-linux-gnu
            MAIL=/var/spool/mail/lei
            INPUTRC=/etc/inputrc
            LANG=en_US
            LOGNAME=lei
            SHLVL=1
            SHELL=/bin/bash
            HOSTTYPE=i386
            OSTYPE=linux-gnu
            HISTSIZE=1000
            TERM=ansi
            HOME=/home/lei
            PATH=/usr/local/bin:/bin:/usr/bin:/usr/X11R6/bin:/home/lei/bin
            _=./main

咱们看到，程序将"./main"做为第1个命令行参数，因此咱们一共有3个命令行参数。这可能与你们平时习惯的说法有些不一样，当心不要搞错了。

如今回过头来看一下exec函数族，先把注意力集中在execve上：

int execve(const char *path, char *const argv[], char *const envp[]);

对比一下main函数的完整形式，看出问题了吗？是的，这两个函数里的argv和envp是彻底一一对应的关系。execve第1个参数path是被执行应用程序的完整路径，第2个参数argv就是传给被执行应用程序的命令行参数，第3个参数envp是传给被执行应用程序的环境变量。

留心看一下这6个函数还能够发现，前3个函数都是以execl开头的，后3个都是以execv开头的，它们的区别在于，execv开头的函数是以"char *argv[]"这样的形式传递命令行参数，而execl开头的函数采用了咱们更容易习惯的方式，把参数一个一个列出来，而后以一个NULL表示结束。这里的NULL的做用和argv数组里的NULL做用是同样的。

在所有6个函数中，只有execle和execve使用了char *envp[]传递环境变量，其它的4个函数都没有这个参数，这并不意味着它们不传递环境变量，这4个函数将把默认的环境变量不作任何修改地传给被执行的应用程序。而execle和execve会用指定的环境变量去替代默认的那些。

还有2个以p结尾的函数execlp和execvp，咋看起来，它们和execl与execv的差异很小，事实也确是如此，除execlp和execvp以外的4个函数都要求，它们的第1个参数path必须是一个完整的路径，如"/bin/ls"；而execlp和execvp的第1个参数file能够简单到仅仅是一个文件名，如"ls"，这两个函数能够自动到环境变量PATH制定的目录里去寻找。

1.10.3 实战

知识介绍得差很少了，接下来咱们看看实际的应用：

/* exec.c */
            #include <unistd.h>
            main()
            {
            char *envp[]={"PATH=/tmp",
            "USER=lei",
            "STATUS=testing",
            NULL};
            char *argv_execv[]={"echo", "excuted by execv", NULL};
            char *argv_execvp[]={"echo", "executed by execvp", NULL};
            char *argv_execve[]={"env", NULL};
            if(fork()==0)
            if(execl("/bin/echo", "echo", "executed by execl", NULL)<0)
            perror("Err on execl");
            if(fork()==0)
            if(execlp("echo", "echo", "executed by execlp", NULL)<0)
            perror("Err on execlp");
            if(fork()==0)
            if(execle("/usr/bin/env", "env", NULL, envp)<0)
            perror("Err on execle");
            if(fork()==0)
            if(execv("/bin/echo", argv_execv)<0)
            perror("Err on execv");
            if(fork()==0)
            if(execvp("echo", argv_execvp)<0)
            perror("Err on execvp");
            if(fork()==0)
            if(execve("/usr/bin/env", argv_execve, envp)<0)
            perror("Err on execve");
            }

程序里调用了2个Linux经常使用的系统命令，echo和env。echo会把后面跟的命令行参数原封不动的打印出来，env用来列出全部环境变量。

因为各个子进程执行的顺序没法控制，因此有可能出现一个比较混乱的输出--各子进程打印的结果交杂在一块儿，而不是严格按照程序中列出的次序。

编译并运行：

$ cc exec.c -o exec
            $ ./exec
            executed by execl
            PATH=/tmp
            USER=lei
            STATUS=testing
            executed by execlp
            excuted by execv
            executed by execvp
            PATH=/tmp
            USER=lei
            STATUS=testing

果真不出所料，execle输出的结果跑到了execlp前面。

你们在平时的编程中，若是用到了exec函数族，必定记得要加错误判断语句。由于与其余系统调用比起来，exec很容易受伤，被执行文件的位置，权限等不少因素都能致使该调用的失败。最多见的错误是：

找不到文件或路径，此时errno被设置为ENOENT；
数组argv和envp忘记用NULL结束，此时errno被设置为EFAULT；
没有对要执行文件的运行权限，此时errno被设置为EACCES。