Linux执行ls，会引发哪些系统调用

时间 2020-02-21

标签 linux 执行引发哪些系统调用栏目 Linux 繁體版

原文原文链接

从一个问题提及html

Linux执行ls，会引发哪些系统调用？linux

A. nmapshell

B. read编程

C. execve数组

D. fork网络

答案是read、exec系列函数

首先咱们讨论一下什么是系统调用（system calls）？
用户借助UNIX/linux直接提供的少许函数能够对文件和设备进行访问和控制，这些函数就是系统调用[1]。.net

使用strace ls命令咱们能够查看ls命令使用到的系统调用[2]，其中一部分输出内容以下:命令行

open(".", O_RDONLY|O_NONBLOCK|O_LARGEFILE|O_DIRECTORY|O_CLOEXEC) = 3
getdents64(3, /* 68 entries */, 32768)  = 2240
getdents64(3, /* 0 entries */, 32768)   = 0
close(3)                                = 0

open系统调用打开当前目录文件，返回得到的文件描述符。能够看到该文件使用O_RDONLY标志打开。设计

只要该文件是用O_RDONLY或O_RDWR标志打开的，就能够用read()系统调用从该文件中读取字节[3]。

因此ls要用到read系统调用。除此以外，任何shell命令都会建立进程，都会用到exec系统调用。

回过头来梳理一下咱们对于这些概念可能产生的疑惑：

包括ls在内，一个程序是如何运行的？
open系统调用打开当前目录文件，返回得到的文件描述符。那什么是文件描述符？

1 进程是如何运行的

每一个运行中的程序被称为进程[1]

Unix将进程建立与加载一个新进程映象分离。这样的好处是有更多的余地对两种操做进行管理。当咱们建立了一个进程以后，一般将子进程替换成新的进程映象。因此任何shell命令都会建立进程，都会用到exec系统调用。
例如：在shell命令行执行ps命令，其实是shell进程调用fork复制一个新的子进程，在利用exec系统调用将新产生的子进程彻底替换成ps进程。

用exec函数能够把当前进程替换为一个新进程，且新进程与原进程有相同的PID。exec名下是由多个关联函数组成的一个完整系列[4]

调用fork建立新进程后，父进程与子进程几乎如出一辙[1，p398]。

fork是一个UNIX术语，当fork一个进程（一个运行中的程序）时，基本上是复制了它，而且fork后的两个进程都从当前执行点继续运行，而且每一个进程都有本身的内存副本。

原进程是父进程，新进程是子进程。能够经过fork()返回值区分。

父进程中fork调用返回的是新的子进程的pid（process id），而子进程中fork调用返回的是0

举个例子:

#include<unistd.h>
#include<stdio.h>
#define LEN 10
int main()
{
    pid_t id=getpid();
    printf("Main pid: %d \n",id);
	int i;
	pid_t res=fork();
	if(res==0)
	{
	  for(i =0;i<LEN;i++) 
	  {
		pid_t id1=getpid();
		printf("%d ",id1);
		printf("Child process:%d\n",i);
	  }
	}
	else
	{
	  printf("res %d\n",res);
	  for(i=0;i<LEN;i++) 
	  {
		pid_t  id2=getpid();
		printf("%d ",id2);
		printf("parent process:%d\n",i);
	  }
	}

	printf("THE END\n");
	 return 0;
}

/*output
Main pid: 10965 
res 10966
10965 parent process:0
10965 parent process:1
10965 parent process:2
10965 parent process:3
10965 parent process:4
10965 parent process:5
10965 parent process:6
10965 parent process:7
10965 parent process:8
10965 parent process:9
10966 Child process:0
10966 Child process:1
THE END
10966 Child process:2
10966 Child process:3
10966 Child process:4
10966 Child process:5
10966 Child process:6
10966 Child process:7
10966 Child process:8
10966 Child process:9
THE END
*/

若是想要程序启动另外一程序的执行但本身仍想继续运行的话，怎么办呢？那就是结合fork与exec的使用[6][1, p397]

举个例子(修改自[6])：

#include<string.h>
 #include <errno.h>
 #include <stdio.h>
 #include <stdlib.h>
#include<unistd.h>
 
 char command[256];
 void main()
 {
    int rtn; /*子进程的返回数值*/
    while(1) {
       /* 从终端读取要执行的命令 */
       printf( ">" );
       fgets( command, 256, stdin );
       command[strlen(command)-1] = 0;
       if ( fork() == 0 ) {/* 子进程执行此命令 */
          execlp( command, NULL );
          /* 若是exec函数返回，代表没有正常执行命令，打印错误信息*/
          perror( command );
          exit( errno );
       }
       else {/* 父进程， 等待子进程结束，并打印子进程的返回值 */
          pid_t sonid=wait ( &rtn );
          printf(" child pid: %d\n",sonid);
          printf( " child process return %d\n", rtn );
       }
   }
}

/*output:错误命令、须要参数命令、正确命令
>aa
aa: No such file or directory
 child pid: 11230
 child process return 512
>echo
A NULL argv[0] was passed through an exec system call.
 child pid: 11231
 child process return 134
>ps
 child pid: 11247
 child process return 139
*/

先fork，而后子进程借助exec调用程序command。对错误命令、须要参数的命令、以及不须要参数的命令给出对应的输出。

2 文件描述符（file descripter，fd）

一切设备均可以看做文件。

对内核而言，全部打开的文件都经过文件描述符引用[7]。文件描述符是非负整数，范围是[0,OPEN_MAX -1]。如今OPEN_MAX 通常为64

可是[7]又说对于FreeBSD 8.0，Linux 3.2.0 ，Mac OS X 10.6.8等， fd变化范围几乎无限，只受到存储器数量、int字长以及系统管理员所配置的软限制和硬限制的约束。。。why？

当open或者create一个新文件时，内核向进程返回一个文件描述符。

当读、写一个文件时，使用open或create返回的文件描述符标识该文件，将其做为参数传送给read / write

按照惯例，fd为0 / 1 / 2分别关联STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO。这些常量也定义在unistd.h.

3 系统调用包含在哪些头文件中呢？

包括exec、fork、read、write在内，许多系统调用包含在unistd.h头文件中

POSIX,Portable Operating System Interface。是UNIX系统的一个设计标准,不少类UNIX系统也在支持兼容这个标准,如Linux。
unistd.h是POSIX标准定义的unix类系统定义符号常量的头文件，包含了许多UNIX系统服务的函数原型[5]。在该头文件，用于访问设备驱动程序的底层函数（系统调用）有这五个：open/close/read/write/ioctl[1]。

4 文件I/O

[7]中提到大多数文件I/O用到的5个函数为：open/read/write/lseek/close

4.1 函数read

调用read函数从打开文件中读数据。

#include<unistd.h>
ssize_t read(int filedes, void *buf, size_t nbytes);

返回值：

成功，读出的字节数；

失败，-1；

遇到文件尾，0

有多种状况可以使实际读到的字节数少于要求读的字节数：

读普通文件时，在读到要求字节数以前已经到达了文件尾端。

例如，若在到达文件尾端以前还有30个字节，而要求读100个字节，则read返回30，下一次再调用read时，它将回0。

当从终端设备读时，一般一次最多读一行
当从网络读时，网络中的缓冲机构可能形成返回值小于所要求读的字节数。
当从管道或FIFO读时，如若管道包含的字节少于所需的数量，那么read将只返回实际可用的字节数。
当从某些面向记录的设备（例如磁盘）读时，一次最多返回一个记录。
当某一信号形成中断，而已经读了部分数据量时。读操做从文件的当前偏移量出开始，在成功返回以前，该偏移量将增长实际独到的字节数

read的经典原型定义则是：

int read(int fd, char*buf, unsigned nbytes);

References

1 linux程序设计第四版
2 ls命令实现分析
3 linux系统编程之文件与IO（二）：系统调用read和write
4 linux系统编程之进程（五）：exec系列函数（execl,execlp,execle,execv,execvp)使用
5 linux标准库#include <unistd.h>
6 Linux下Fork与Exec使用
7 Unix环境高级编程（第三版）