我是如何学习写一个操做系统（九）：文件系统

时间 2019-11-08

标签如何学习一个系统文件繁體版

原文原文链接

前言

这个应该是这个系列的尾声了，一个完整的操做系统可能最主要的也就是分红这几大模块：进程管理、内存管理和文件系统。计算机以进程为基本单位进行资源的调度和分配；而与用户的交互，基本单位则是文件node

生磁盘

文件正是对生磁盘的抽象git

磁盘的组成

一个磁盘由多个盘面串联而成，而一个盘面又被分为磁道，磁道又由扇区组成。github

磁盘的访问单元就是扇区，一个扇区为512字节算法

磁盘的使用

CPU向磁盘的控制器发出一个指令
控制器开始进行寻道、旋转和传输
最后完成后向CPU发送一个中断

也就是向控制器发送柱面磁头扇区等信息，而后等待回应数组

盘块

盘块是对扇区的抽象数据结构

程序负责提升盘块block，而磁盘驱动负责从block计算出cyl，head，sec(CHS)，最后传递到磁盘控制器上app

磁盘访问时间 = 写入控制器时间 + 寻道时间 + 旋转时间 + 传输时间ide

其中主要的时间都在寻道时间和旋转时间，因此对扇区抽象成盘块就能够一次访问多个扇区来节省磁盘的访问时间函数

磁盘调度

既然有多进程交替执行，就有可能多个进程同时访问相同磁盘的状况，就须要一个请求队列来处理全部请求，就会涉及到调度算法了this

FCFS调度

FCFS是最公平最直观的算法，也就是按照队列顺序来访问磁盘，可是效率也很低下，磁头会在不规律的磁道长途奔袭

SSTF调度

SSTF算法就相似短做业优先算法，先寻找更近距离的磁道，可是SSTF算法可能会产生饥饿问题，过长距离的磁道可能一直得不处处理

SCAN调度

SCAN算法就是SSTF算法的改良版，也就是进行SSTF，可是在中途不会折返去寻找更短距离的磁道，这样就避免了饥饿问题

C-SCAN调度(电梯算法)

把扫描限定在一个方向，当访问到某个方向的最后一个磁道时，磁道返回磁盘相反方向磁道的末端，并再次开始扫描。

文件和文件系统

文件是对磁盘的第三层抽象，扇区和盘块分别是前两层抽象。之因此有文件这层抽象是为了方便用户的使用，在用户的眼里，磁盘上的信息均可以看做是字符流。因此文件的抽象九能够看做是字符流到盘块集合的映射关系

文件的逻辑结构

从文件到盘块的映射来看，通常有这几种组织方式

顺序文件

记录是定长的且按关键字顺序排列。能够顺序存储或以链表形势存储，在访问时须要顺序搜索文件。顺序文件有如下两种结构：
1. 第一种是串结构，各记录之间的顺序与关键字无关。一般的办法是由时间来决定，即按存入时间的前后排列，最早存入的记录做为第一个记录，其次存入的为第二个记录，以此类推。
2. 第二种是顺序结构，指文件中全部记录按关键字顺序排列。在对记录进行批量操做时，即每次要读或写一大批记录，对顺序文件的效率是全部逻辑文件中最高的；此外，也只有顺序文件才能存储在磁带上，并能有效的工做。但顺序文件对查找、修改、增长或删除单个记录的操做比较困难。
索引文件

对于可变长记录的文件只能顺序查找，系统开销较大，为此能够创建一张索引表以加快检索速度，索引表自己是顺序文件。在记录不少或是访问要求高的文件中，须要引入索引以提供有效的访问，实际中，经过索引能够成百上千倍的提升访问速度。
索引顺序表

索引顺序表是顺序和索引两种组织形势的结合。索引顺序文件将顺序文件中全部记录分为若干个组，为顺序文件创建一张索引表，在索引表中为每组中的第一个记录创建一个索引项，其中含有该记录的关键字值和指向该记录的指针。

在实际的操做系统实现中，通常是采用多级索引

目录和文件系统

文件系统或者说目录是对磁盘的第四个抽象，也就是抽象了整个磁盘

操做系统为了实现文件目录，引入了称为文件控制块的数据结构。

文件控制块。

文件控制块（FCB）是用来存放控制文件须要的各类信息的数据结构，以实现“按名存取”。FCB的有序集合称为文件目录，一个FCB就是一个文件目录项。为了建立一个新文件，系统将分配一个FCB并存放在文件目录中，称为目录项。

FCB主要包含如下信息：

基本信息，如文件名、文件的物理位置、文件的逻辑结构、文件的物理结构等。
存取控制信息，如文件的存取权限等。
使用信息，如文件创建时间、修改时间等。

文件目录树

在多级目录下通常对磁盘就能够抽象为

FCB数组

FCB数组就是将全部盘块的FCB信息都集中到一个数组中
数据盘块集合

在每一个数据盘块里都包含一些目录项用来找到子目录，目录项也就是文件名+对应的FCB的“地址”，也就是去以前的FCB数组中找到相应的FCB

在磁盘进行格式化的时候，会存放一些信息用来知道一些磁盘信息和找到根目录

inode位图: 哪些inode空闲，哪些被占用
超级块:记录两个位图有多大等信息
盘块位图: 哪些盘块是空闲的，硬盘大小不一样这个位图的大小也不一样

文件的实现

在我以前实现的FragileOS里文件系统很是简陋，基本没有什么好说的。这其实也是为何以前把这个系列改了一个方向来结合的看Linux0.11的代码。因此来看一下Linux0.11里是怎么使用和实现文件系统的，

读取文件

这是读取文件的系统调用
函数首先对参数有效性进行判断
以后对文件的类型进行判断
若是是目录文件或者是常规文件就执行读取操做

int sys_read(unsigned int fd,char * buf,int count) {
	struct file * file;
	struct m_inode * inode;

	if (fd>=NR_OPEN || count<0 || !(file=current->filp[fd]))
		return -EINVAL;
	if (!count)
		return 0;
	verify_area(buf,count);
	inode = file->f_inode;
	if (inode->i_pipe)
		return (file->f_mode&1)?read_pipe(inode,buf,count):-EIO;
	if (S_ISCHR(inode->i_mode))
		return rw_char(READ,inode->i_zone[0],buf,count,&file->f_pos);
	if (S_ISBLK(inode->i_mode))
		return block_read(inode->i_zone[0],&file->f_pos,buf,count);
	if (S_ISDIR(inode->i_mode) || S_ISREG(inode->i_mode)) {
		if (count+file->f_pos > inode->i_size)
			count = inode->i_size - file->f_pos;
		if (count<=0)
			return 0;
		return file_read(inode,file,buf,count);
	}
	printk("(Read)inode->i_mode=%06o\n\r",inode->i_mode);
	return -EINVAL;
}
复制代码

根据i节点和文件结构，读取文件中数据。
首先判断参数的有效性
以后循环的调用bread来读取数据
以后复制chars字节到用户缓冲区buf中
最后是修改该i节点的访问时间为当前时间和返回读取的字节数

int file_read(struct m_inode * inode, struct file * filp, char * buf, int count) {
	int left,chars,nr;
	struct buffer_head * bh;

	if ((left=count)<=0)
		return 0;
	while (left) {
		if ((nr = bmap(inode,(filp->f_pos)/BLOCK_SIZE))) {
			if (!(bh=bread(inode->i_dev,nr)))
				break;
		} else
			bh = NULL;
		nr = filp->f_pos % BLOCK_SIZE;
		chars = MIN( BLOCK_SIZE-nr , left );
		filp->f_pos += chars;
		left -= chars;
		if (bh) {
			char * p = nr + bh->b_data;
			while (chars-->0)
				put_fs_byte(*(p++),buf++);
			brelse(bh);
		} else {
			while (chars-->0)
				put_fs_byte(0,buf++);
		}
	}
	inode->i_atime = CURRENT_TIME;
	return (count-left)?(count-left):-ERROR;
}
复制代码

文件写入

根据i节点和文件结构信息，将用户数据写入文件中
首先肯定数据写入文件的位置
而后算出对应的盘块
而后用户缓冲区buf中复制c个字节到告诉缓冲块中p指向的开始位置处
最后是修改该i节点的访问时间为当前时间和返回读取的字节数

int file_write(struct m_inode * inode, struct file * filp, char * buf, int count) {
	off_t pos;
	int block,c;
	struct buffer_head * bh;
	char * p;
	int i=0;

/* * ok, append may not work when many processes are writing at the same time * but so what. That way leads to madness anyway. */
	if (filp->f_flags & O_APPEND)
		pos = inode->i_size;
	else
		pos = filp->f_pos;
	while (i<count) {
		if (!(block = create_block(inode,pos/BLOCK_SIZE)))
			break;
		if (!(bh=bread(inode->i_dev,block)))
			break;
		c = pos % BLOCK_SIZE;
		p = c + bh->b_data;
		bh->b_dirt = 1;
		c = BLOCK_SIZE-c;
		if (c > count-i) c = count-i;
		pos += c;
		if (pos > inode->i_size) {
			inode->i_size = pos;
			inode->i_dirt = 1;
		}
		i += c;
		while (c-->0)
			*(p++) = get_fs_byte(buf++);
		brelse(bh);
	}
	inode->i_mtime = CURRENT_TIME;
	if (!(filp->f_flags & O_APPEND)) {
		filp->f_pos = pos;
		inode->i_ctime = CURRENT_TIME;
	}
	return (i?i:-1);
}
复制代码

文件目录的实现

打开建立文件

首先对参数进行处理，而后搜索进程结构中文件结构指针数组一个空闲的文件句柄
接着为打开文件在文件表中寻找一个空闲结构项
而后调用函数open_namei()执行打开操做，若返回值小于0，则说明出错，就释放刚申请到的文件结构
而后为不一样的文件类型作一些特殊的处理
最后初始化打开文件的文件结构，而后返回文件句柄

int sys_open(const char * filename,int flag,int mode) {
	struct m_inode * inode;
	struct file * f;
	int i,fd;

	mode &= 0777 & ~current->umask;
	for(fd=0 ; fd<NR_OPEN ; fd++)
		if (!current->filp[fd])
			break;
	if (fd>=NR_OPEN)
		return -EINVAL;
	current->close_on_exec &= ~(1<<fd);
	f=0+file_table;
	for (i=0 ; i<NR_FILE ; i++,f++)
		if (!f->f_count) break;
	if (i>=NR_FILE)
		return -EINVAL;
	(current->filp[fd]=f)->f_count++;
	if ((i=open_namei(filename,flag,mode,&inode))<0) {
		current->filp[fd]=NULL;
		f->f_count=0;
		return i;
	}
/* ttys are somewhat special (ttyxx major==4, tty major==5) */
	if (S_ISCHR(inode->i_mode)) {
		if (MAJOR(inode->i_zone[0])==4) {
			if (current->leader && current->tty<0) {
				current->tty = MINOR(inode->i_zone[0]);
				tty_table[current->tty].pgrp = current->pgrp;
			}
		} else if (MAJOR(inode->i_zone[0])==5)
			if (current->tty<0) {
				iput(inode);
				current->filp[fd]=NULL;
				f->f_count=0;
				return -EPERM;
			}
	}
/* Likewise with block-devices: check for floppy_change */
	if (S_ISBLK(inode->i_mode))
		check_disk_change(inode->i_zone[0]);
	f->f_mode = inode->i_mode;
	f->f_flags = flag;
	f->f_count = 1;
	f->f_inode = inode;
	f->f_pos = 0;
	return (fd);
}
复制代码

解析目录

先根据当前路径的第一个字符来判断当前路径是绝对路径仍是相对路径
而后进循环处理过程，分割每一个目录名
获得这个目录名后，调用查找目录项函数find_entry()在当前处理的目录中寻找指定名称的目录
若是找到这个目录，就设置一些信息，而后继续以该目录项为当前目录继续循环处理路径名中的下一目录名部分（或文件名）

static struct m_inode * get_dir(const char * pathname) {
	char c;
	const char * thisname;
	struct m_inode * inode;
	struct buffer_head * bh;
	int namelen,inr,idev;
	struct dir_entry * de;

	if (!current->root || !current->root->i_count)
		panic("No root inode");
	if (!current->pwd || !current->pwd->i_count)
		panic("No cwd inode");
	if ((c=get_fs_byte(pathname))=='/') {
		inode = current->root;
		pathname++;
	} else if (c)
		inode = current->pwd;
	else
		return NULL;	/* empty name is bad */
	inode->i_count++;
	while (1) {
		thisname = pathname;
		if (!S_ISDIR(inode->i_mode) || !permission(inode,MAY_EXEC)) {
			iput(inode);
			return NULL;
		}
		for(namelen=0;(c=get_fs_byte(pathname++))&&(c!='/');namelen++)
			/* nothing */ ;
		if (!c)
			return inode;
		if (!(bh = find_entry(&inode,thisname,namelen,&de))) {
			iput(inode);
			return NULL;
		}
		inr = de->inode;
		idev = inode->i_dev;
		brelse(bh);
		iput(inode);
		if (!(inode = iget(idev,inr)))
			return NULL;
	}
}
复制代码