Linux 文件系统的实现

时间 2019-12-10

标签 linux 文件系统实现栏目 Linux 繁體版

原文原文链接

Linux文件管理从用户的层面介绍了Linux管理文件的方式。Linux有一个树状结构来组织文件。树的顶端为根目录(/)，节点为目录，而末端的叶子为包含数据的文件。当咱们给出一个文件的完整路径时，咱们从根目录出发，通过沿途各个目录，最终到达文件。html

咱们能够对文件进行许多操做，好比打开和读写。在Linux文件管理相关命令中，咱们看到许多对文件进行操做的命令。它们大都基于对文件的打开和读写操做。好比cat能够打开文件，读取数据，最后在终端显示：node

$cat test.txt

对于Linux下的程序员来讲，了解文件系统的底层组织方式，是深刻进行系统编程所必备的。即便是普通的Linux用户，也能够根据相关的内容，设计出更好的系统维护方案。程序员

存储设备分区

文件系统的最终目的是把大量数据有组织的放入持久性(persistant)的存储设备中，好比硬盘和磁盘。这些存储设备与内存不一样。它们的存储能力具备持久性，不会由于断电而消失；存储量大，但读取速度慢。编程

观察常见存储设备。最开始的区域是MBR，用于Linux开机启动(参考Linux开机启动)。剩余的空间可能分红数个分区(partition)。每一个分区有一个相关的分区表(Partition table)，记录分区的相关信息。这个分区表是储存在分区以外的。分区表说明了对应分区的起始位置和分区的大小。segmentfault

咱们在Windows系统经常看到C分区、D分区等。Linux系统下也能够有多个分区，但都被挂载在同一个文件系统树上。数组

数据被存入到某个分区中。一个典型的Linux分区(partition)包含有下面各个部分:spa

分区的第一个部分是启动区(Boot block)，它主要是为计算机开机服务的。Linux开机启动后，会首先载入MBR，随后MBR从某个硬盘的启动区加载程序。该程序负责进一步的操做系统的加载和启动。为了方便管理，即便某个分区中没有安装操做系统，Linux也会在该分区预留启动区。操作系统

启动区以后的是超级区(Super block)。它存储有文件系统的相关信息，包括文件系统的类型，inode的数目，数据块的数目。设计

随后是多个inodes，它们是实现文件存储的关键。在Linux系统中，一个文件能够分红几个数据块存储，就好像是分散在各地的龙珠同样。为了顺利的收集齐龙珠，咱们须要一个“雷达”的指引：该文件对应的inode。每一个文件对应一个inode。这个inode中包含多个指针，指向属于该文件各个数据块。当操做系统须要读取文件时，只须要对应inode的"地图"，收集起分散的数据块，就能够收获咱们的文件了。指针

最后一部分，就是真正储存数据的数据块们(data blocks)了。

inode简介

上面咱们看到了存储设备的宏观结构。咱们要深刻到分区的结构，特别是文件在分区中的存储方式。

文件是文件系统对数据的分割单元。文件系统用目录来组织文件，赋予文件以上下分级的结构。在硬盘上实现这一分级结构的关键，是使用inode来虚拟普通文件和目录文件对象。

在Linux文件管理中，咱们知道，一个文件除了自身的数据以外，还有一个附属信息，即文件的元数据(metadata)。这个元数据用于记录文件的许多信息，好比文件大小，拥有人，所属的组，修改日期等等。元数据并不包含在文件的数据中，而是由操做系统维护的。事实上，这个所谓的元数据就包含在inode中。咱们能够用$ls -l filename来查看这些元数据。正如咱们上面看到的，inode所占据的区域与数据块的区域不一样。每一个inode有一个惟一的整数编号(inode number)表示。

在保存元数据，inode是“文件”从抽象到具体的关键。正如上一节中提到的，inode储存由一些指针，这些指针指向存储设备中的一些数据块，文件的内容就储存在这些数据块中。当Linux想要打开一个文件时，只须要找到文件对应的inode，而后沿着指针，将全部的数据块收集起来，就能够在内存中组成一个文件的数据了。

数据块在1, 32, 0, ...

inode并非组织文件的惟一方式。最简单的组织文件的方法，是把文件依次顺序的放入存储设备，DVD就采起了相似的方式。但若是有删除操做，删除形成的空余空间夹杂在正常文件之间，很难利用和管理。

复杂的方式可使用链表，每一个数据块都有一个指针，指向属于同一文件的下一个数据块。这样的好处是能够利用零散的空余空间，坏处是对文件的操做必须按照线性方式进行。若是想随机存取，那么必须遍历链表，直到目标位置。因为这一遍历不是在内存进行，因此速度很慢。

FAT系统是将上面链表的指针取出，放入到内存的一个数组中。这样，FAT能够根据内存的索引，迅速的找到一个文件。这样作的主要问题是，索引数组的大小与数据块的总数相同。所以，存储设备很大的话，这个索引数组会比较大。

inode既能够充分利用空间，在内存占据空间不与存储设备相关，解决了上面的问题。但inode也有本身的问题。每一个inode可以存储的数据块指针总数是固定的。若是一个文件须要的数据块超过这一总数，inode须要额外的空间来存储多出来的指针。

inode示例

在Linux中，咱们经过解析路径，根据沿途的目录文件来找到某个文件。目录中的条目除了所包含的文件名，还有对应的inode编号。当咱们输入$cat /var/test.txt时，Linux将在根目录文件中找到var这个目录文件的inode编号，而后根据inode合成var的数据。随后，根据var中的记录，找到text.txt的inode编号，沿着inode中的指针，收集数据块，合成text.txt的数据。整个过程当中，咱们参考了三个inode：根目录文件，var目录文件，text.txt文件的inodes。

在Linux下，可使用$stat filename，来查询某个文件对应的inode编号。

在存储设备中实际上存储为：

当咱们读取一个文件时，其实是在目录中找到了这个文件的inode编号，而后根据inode的指针，把数据块组合起来，放入内存供进一步的处理。当咱们写入一个文件时，是分配一个空白inode给该文件，将其inode编号记入该文件所属的目录，而后选取空白的数据块，让inode的指针指像这些数据块，并放入内存中的数据。

文件共享

在Linux的进程中，当咱们打开一个文件时，返回的是一个文件描述符。这个文件描述符是一个数组的下标，对应数组元素为一个指针。有趣的是，这个指针并无直接指向文件的inode，而是指向了一个文件表格，再经过该表格，指向加载到内存中的目标文件的inode。以下图，一个进程打开了两个文件。

能够看到，每一个文件表格中记录了文件打开的状态(status flags)，好比只读，写入等，还记录了每一个文件的当前读写位置(offset)。当有两个进程打开同一个文件时，能够有两个文件表格，每一个文件表格对应的打开状态和当前位置不一样，从而支持一些文件共享的操做，好比同时读取。

要注意的是进程fork以后的状况，子进程将只复制文件描述符的数组，而和父进程共享内核维护的文件表格和inode。此时要特别当心程序的编写。

总结

这里归纳性的总结了Linux的文件系统。Linux以inode的方式，让数据造成文件。

了解Linux的文件系统，是深刻了解操做系Linux原理的重要一步。

扩展阅读：做者写的《Linux的概念与体系》系列文章。

转载自：Linux文件系统的实现做者：Vamei