MIT6.S081/6.828 实验1：Lab Unix Utilities

Mit6.828/6.S081 fall 2019的Lab1是Unix utilities，主要内容为利用xv6的系统调用实现sleep、pingpong、primes、find和xargs等工具。本文对各程序的实现思路及xv6的系统调用流程进行详细介绍。html

前言

在实验以前，推荐阅读一下官网LEC1中提供的资料。其中Introduction是对该课程的的概述，examples则是几个系统编程的样例，这两部分快速浏览一遍便可。对于xv6 book的第一章，则建议稍微细致地阅读一遍，特别是对fork()、exec()、pipe()、dup()这几个系统调用的介绍，会在后面实验中用到。linux

实验环境搭建参考上一篇文章。进入xv6-riscv-fall19项目后能够看到两个比较重要的目录：kernel为xv6内核源码，里面除了os工做的核心代码（如进程调度），还有向外提供的接口（system call）；user中则是用户程序，如咱们熟悉的ls，echo命令等。本次实验的目的就是在user中增长用户程序，借助kernel中提供的system call来实现所需的功能。git

实验思路

每个Lab须要在对应的分支编写代码，进入xv6-riscv-fall19目录下，使用git checkout util切换到util分支，便可开始编写咱们的程序。下面主要提供实现思路，具体实验代码请参考Github。github

实验完成后使用make grade能够执行单元测试进行评分，会以gdb-server模式启动qemu，并在gradelib.py中模拟gdb-client对咱们的程序进行测试。若是在make grade时报错Timeout! Failed to connect to QEMU，能够将gradelib.py的325行改成self.sock.connect(("127.0.0.1", port))。shell

sleep

sleep功能为使进程睡眠若干个时钟周期（xv6中一个tick为100ms），首先建立user/sleep.c源文件，引入user.h头文件，系统调用和工具函数都定义在该文件里。核心代码以下：编程

sleep(atoi(argv[1]));

完成编写后，在Makefile的UPROGS中追加一行$U/_sleep\。输入make qemu进行编译，成功后进入shell，输入sleep 10，若是进程睡眠了大约1s，则表示程序编写正确。数组

pingpong

功能是父进程经过管道向子进程发送1字节，子进程收到后向父进程回复1字节。函数

因为管道是单向流动的，因此两次调用pipe()建立两个管道，分别对应两个方向。使用fork()建立子进程，在子进程中先从管道1read()再向管道2write()，父进程中则与之相反。工具

primes

primes的功能是输出2~35之间的素数，实现方式是递归fork进程并使用管道连接，造成一条pipeline来对素数进行过滤。oop

每一个进程收到的第一个数p必定是素数，后续的数若是能被p整除则之间丢弃，若是不能则输出到下一个进程，详细介绍可参考文档。伪代码以下：

void primes() {
  p = read from left         // 从左边接收到的第一个数必定是素数
  if (fork() == 0): 
    primes()                 // 子进程，进入递归
  else: 
    loop: 
      n = read from left     // 父进程，循环接收左边的输入  
      if (p % n != 0): 
        write n to right     // 不能被p整除则向右输出   
}

还须要注意两点：

文件描述符溢出： xv6限制fd的范围为0~15，而每次pipe()都会建立两个新的fd，若是不及时关闭不须要的fd，会致使文件描述符资源用尽。这里使用重定向到标准I/O的方式来避免生成新的fd，首先close()关闭标准I/O的fd，而后使用dup()复制所需的管道fd（会自动复制到序号最小的fd，即关闭的标准I/O），随后对pipe两侧fd进行关闭（此时只会移除描述符，不会关闭实际的file对象）。
pipeline关闭： 在完成素数输出后，须要依次退出pipeline上的全部进程。在退出父进程前关闭其标准输入fd，此时read()将读取到eof（值为0），此时一样关闭子进程的标准输入fd，退出进程，这样进程链上的全部进程就能够退出。

find

find功能是在目录中匹配文件名，实现思路是递归搜索整个目录树。

使用open()打开当前fd，用fstat()判断fd的type，若是是文件，则与要找的文件名进行匹配；若是是目录，则循环read()到dirent结构，获得其子文件/目录名，拼接获得当前路径后进入递归调用。注意对于子目录中的.和..不要进行递归。

xargs

xargs的功能是将标准输入转为程序的命令行参数。可配合管道使用，让本来没法接收标准输入的命令能够使用标准输入做为参数。

根据lab中的使用例子能够看出，xv6的xargs每次回车都会执行一次命令并输出结果，直到ctrl+d时结束；而linux中的实现则是一直接收输入，收到ctrl+d时才执行命令并输出结果。

思路是使用两层循环读取标准输入：

内层循环依次读取每个字符，根据空格进行参数分割，将参数字符串存入二维数组中，当读取到'\n'时，退出当前循环；当接收到ctrl+d（read返回的长度<0）时退出程序。
外层循环对每一行输入fork()出子进程，调用exec()执行命令。注意exec接收的二维参数数组argv，第一个参数argv[0]必须是该命令自己，最后一个参数argv[size-1]必须为0，不然将执行失败。

xv6系统调用流程

Lab中对system call的使用很简单，看起来和普通函数调用并无什么区别，但实际上的调用流程是较为复杂的。咱们很容易产生一些疑问：系统调用的整个生命周期具体是什么样的？用户进程和内核进程之间是如何切换上下文的？系统调用的函数名、参数和返回值是如何在用户进程和内核进程之间传递的？

1.用户态调用

在用户空间，全部system call的函数声明写在user.h中，调用后会进入usys.S执行汇编指令：将对应的系统调用号（system call number）置于寄存器a7中，并执行ecall指令进行系统调用，其中函数参数存在a0~a5这6个寄存器中。ecall指令将触发软中断，cpu会暂停对用户程序的执行，转而执行内核的中断处理逻辑，陷入（trap）内核态。

2.上下文切换

中断处理在kernel/trampoline.S中，首先进行上下文的切换，将user进程在寄存器中的数据save到内存中（保护现场），并restore（恢复）kernel的寄存器数据。内核中会维护一个进程数组（最多容纳64个进程），存储每一个进程的状态信息，proc结构体定义在proc.h，这也是xv6对PCB（Process Control Block）的实现。用户程序的寄存器数据将被暂时保存到proc->trapframe结构中。

3.内核态执行

完成进程切换后，调用trap.c/usertrap()，接着进入syscall.c/syscall()，在该方法中根据system call number拿到数组中的函数指针，执行系统调用函数。函数参数从用户进程的trapframe结构中获取(a0~a5)，函数执行的结果则存储于trapframe的a0字段中。完成调用后一样须要进程切换，先save内核寄存器到trapframe->kernel_*，再将trapframe中暂存的user进程数据restore到寄存器，从新回到用户空间，cpu从中断处继续执行，从寄存器a0中拿到函数返回值。

至此，系统调用完成，共经历了两次进程上下文切换：用户进程 -> 内核进程 -> 用户进程，同时伴随着两次CPU工做状态的切换：用户态 -> 内核态 -> 用户态。

实验代码：https://github.com/zhayujie/xv6-riscv-fall19

原文连接：https://zhayujie.com/mit6828-lab-util.html