从一个问题提及html
Linux执行ls,会引发哪些系统调用?linux
A. nmapshell
B. read编程
C. execve数组
D. fork网络
答案是read、exec系列函数
首先咱们讨论一下什么是系统调用(system calls)?
用户借助UNIX/linux直接提供的少许函数能够对文件和设备进行访问和控制,这些函数就是系统调用
[1]。.net
使用strace ls
命令咱们能够查看ls命令使用到的系统调用[2],其中一部分输出内容以下:命令行
open(".", O_RDONLY|O_NONBLOCK|O_LARGEFILE|O_DIRECTORY|O_CLOEXEC) = 3 getdents64(3, /* 68 entries */, 32768) = 2240 getdents64(3, /* 0 entries */, 32768) = 0 close(3) = 0
open系统调用打开当前目录文件,返回得到的文件描述符。能够看到该文件使用O_RDONLY标志打开。设计
只要该文件是用O_RDONLY或O_RDWR标志打开的,就能够用read()
系统调用从该文件中读取字节[3]。
因此ls
要用到read
系统调用。除此以外,任何shell命令都会建立进程,都会用到exec系统调用。
回过头来梳理一下咱们对于这些概念可能产生的疑惑:
每一个运行中的程序被称为进程[1]
Unix将进程建立与加载一个新进程映象分离。这样的好处是有更多的余地对两种操做进行管理。当咱们建立了一个进程以后,一般将子进程替换成新的进程映象。因此任何shell命令都会建立进程,都会用到exec系统调用。
例如:在shell命令行执行ps命令,其实是shell进程调用fork复制一个新的子进程,在利用exec系统调用将新产生的子进程彻底替换成ps进程。
用exec函数能够把当前进程替换为一个新进程,且新进程与原进程有相同的PID。exec名下是由多个关联函数组成的一个完整系列[4]
调用fork建立新进程后,父进程与子进程几乎如出一辙[1,p398]。
fork是一个UNIX术语,当fork一个进程(一个运行中的程序)时,基本上是复制了它,而且fork后的两个进程都从当前执行点继续运行,而且每一个进程都有本身的内存副本。
原进程是父进程,新进程是子进程。能够经过fork()
返回值区分。
父进程中fork调用返回的是新的子进程的pid(process id),而子进程中fork调用返回的是0
举个例子:
#include<unistd.h> #include<stdio.h> #define LEN 10 int main() { pid_t id=getpid(); printf("Main pid: %d \n",id); int i; pid_t res=fork(); if(res==0) { for(i =0;i<LEN;i++) { pid_t id1=getpid(); printf("%d ",id1); printf("Child process:%d\n",i); } } else { printf("res %d\n",res); for(i=0;i<LEN;i++) { pid_t id2=getpid(); printf("%d ",id2); printf("parent process:%d\n",i); } } printf("THE END\n"); return 0; } /*output Main pid: 10965 res 10966 10965 parent process:0 10965 parent process:1 10965 parent process:2 10965 parent process:3 10965 parent process:4 10965 parent process:5 10965 parent process:6 10965 parent process:7 10965 parent process:8 10965 parent process:9 10966 Child process:0 10966 Child process:1 THE END 10966 Child process:2 10966 Child process:3 10966 Child process:4 10966 Child process:5 10966 Child process:6 10966 Child process:7 10966 Child process:8 10966 Child process:9 THE END */
若是想要程序启动另外一程序的执行但本身仍想继续运行的话,怎么办呢?那就是结合fork与exec的使用[6][1, p397]
举个例子(修改自[6]):
#include<string.h> #include <errno.h> #include <stdio.h> #include <stdlib.h> #include<unistd.h> char command[256]; void main() { int rtn; /*子进程的返回数值*/ while(1) { /* 从终端读取要执行的命令 */ printf( ">" ); fgets( command, 256, stdin ); command[strlen(command)-1] = 0; if ( fork() == 0 ) {/* 子进程执行此命令 */ execlp( command, NULL ); /* 若是exec函数返回,代表没有正常执行命令,打印错误信息*/ perror( command ); exit( errno ); } else {/* 父进程, 等待子进程结束,并打印子进程的返回值 */ pid_t sonid=wait ( &rtn ); printf(" child pid: %d\n",sonid); printf( " child process return %d\n", rtn ); } } } /*output:错误命令、须要参数命令、正确命令 >aa aa: No such file or directory child pid: 11230 child process return 512 >echo A NULL argv[0] was passed through an exec system call. child pid: 11231 child process return 134 >ps child pid: 11247 child process return 139 */
先fork,而后子进程借助exec调用程序command。对错误命令、须要参数的命令、以及不须要参数的命令给出对应的输出。
一切设备均可以看做文件。
对内核而言,全部打开的文件都经过文件描述符引用[7]。文件描述符是非负整数,范围是[0,OPEN_MAX -1]。如今OPEN_MAX 通常为64
可是[7]又说对于FreeBSD 8.0,Linux 3.2.0 ,Mac OS X 10.6.8等, fd变化范围几乎无限,只受到存储器数量、int字长以及系统管理员所配置的软限制和硬限制的约束。。。why?
当open或者create一个新文件时,内核向进程返回一个文件描述符。
当读、写一个文件时,使用open或create返回的文件描述符标识该文件,将其做为参数传送给read / write
按照惯例,fd为0 / 1 / 2分别关联STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO。这些常量也定义在unistd.h
.
包括exec、fork、read、write在内,许多系统调用包含在unistd.h
头文件中
POSIX,Portable Operating System Interface。是UNIX系统的一个设计标准,不少类UNIX系统也在支持兼容这个标准,如Linux。
unistd.h
是POSIX标准定义的unix类系统定义符号常量的头文件,包含了许多UNIX系统服务的函数原型[5]。在该头文件,用于访问设备驱动程序的底层函数(系统调用)有这五个:open/close/read/write/ioctl
[1]。
[7]中提到大多数文件I/O用到的5个函数为:open/read/write/lseek/close
调用read函数从打开文件中读数据。
#include<unistd.h> ssize_t read(int filedes, void *buf, size_t nbytes);
返回值:
成功,读出的字节数;
失败,-1;
遇到文件尾,0
有多种状况可以使实际读到的字节数少于要求读的字节数:
例如,若在到达文件尾端以前还有30个字节,而要求读100个字节,则read返回30,下一次再调用read时,它将回0。
当从终端设备读时,一般一次最多读一行
当从网络读时,网络中的缓冲机构可能形成返回值小于所要求读的字节数。
当从管道或FIFO读时,如若管道包含的字节少于所需的数量,那么read将只返回实际可用的字节数。
当从某些面向记录的设备(例如磁盘)读时,一次最多返回一个记录。
当某一信号形成中断,而已经读了部分数据量时。读操做从文件的当前偏移量出开始,在成功返回以前,该偏移量将增长实际独到的字节数
read的经典原型定义则是:
int read(int fd, char*buf, unsigned nbytes);