Linux 的文件与曼目录node
现代操做系统为解决信息能独立于进程以外被长期储存引入了文件,文件做为进程建立信息的逻辑单元可被多个进程并发使用。在Unix系统中,操做系统为磁盘上的文本与图像,鼠标与键盘灯输入设备及网络交互等 I/O 操做设计了一组通用API,使他们被处理时都可统一使用字节流方式。换言之,Unix系统中除进程以外的一切皆是文件,而Linux保持了这一特性。为了便于文件的管理,Linux还引入了目录(有时也被称为文件夹)这一律念,目录使文件被分类管理,且目录的引入使Linux的文件系统造成一个层级结构的目录树。下图所示的是普通Linux系统的顶层目录结构,其中/dev 是存放了设备相关文件的目录linux
/ 根目录 ├── bin 存放用户二进制文件 ├── boot 存放内核引导配置文件 ├── dev 存放设备文件 ├── etc 存放系统配置文件 ├── home 用户主目录 ├── lib 动态共享库 ├── lost+found 文件系统恢复时的恢复文件 ├── media 可卸载存储介质挂载点 ├── mnt 文件系统临时挂载点 ├── opt 附加的应用程序包 ├── proc 系统内存的映射目录,提供内核与进程信息 ├── root root 用户主目录 ├── sbin 存放系统二进制文件 ├── srv 存放服务相关数据 ├── sys sys 虚拟文件系统挂载点 ├── tmp 存放临时文件 ├── usr 存放用户应用程序 └── var 存放邮件、系统日志等变化文件
Linux 与其余类Unix系统同样并不区分文件和目录:目录是记录了其余文件名的文件。使用命令mkdir 建立目录时,若指望建立的目录的名称与现有的文件名(或目录名)重复,则会建立失败。shell
int fd; struct input_event ie; fd = open("/dev/input/event5", O_RDONLY); read(fd, &ie, sizeof(struct input_event)); printf("type = %d code = %d value = %d\n", ie.type, ie.code, ie.value); close(fd);
# stat /home/harris/source/glibc-2.16.0.tar.xz File: `/home/harris/source/glibc-2.16.0.tar.xz' Size: 9990512 Blocks: 19520 IO Block: 4096 regular file Device: 807h/2055d Inode: 2485677 Links: 1 Access: (0600/-rw-------) Uid: ( 1000/ harris) Gid: ( 1000/ harris) ... ... # mv /home/harris/source/glibc-2.16.0.tar.xz /home/harris/Desktop/glibc.tar.xz # ls -i -F /home/harris/Desktop/glibc.tar.xz 2485677 /home/harris/Desktop/glibc.tar.xz
在 Linux 系统中查看 inode 号 可以使用命令 stat 或 ls -i(如果 AIX 系统,则使用命令 istat )。在上图中使用命令mv移动并重命名文件glibc-2.16.0.tar.xz 其结果不影响文件的 用户数据及inode 号,文件移动先后 inode 号均为:2485677.数据库
为了解决文件的共享使用,Linux 系统引入两种连接:硬连接(hard link)和软连接(又称符号连接,即soft link 或 symbolic link)。连接为Linux系统解决了文件的共享使用,还带来了隐藏文件路径,增长权限安全及节省储存等好处。若一个inode号对应多个文件名,则称这些文件为硬连接。换言之,硬连接就是同一个文件使用多个别名。硬连接可由命令 link 或 ln 建立。以下是对文件oldfile 建立硬连接。缓存
link oldfile newfile
ln oldfile newfile
因为硬连接是有着相同 inode 号仅文件名不一样的文件,所以硬连接存在如下几个特性:安全
# ls -li total 0 // 只能对已存在的文件建立硬链接 # link old.file hard.link link: cannot create link `hard.link' to `old.file': No such file or directory # echo "This is an original file" > old.file # cat old.file This is an original file # stat old.file File: `old.file' Size: 25 Blocks: 8 IO Block: 4096 regular file Device: 807h/2055d Inode: 660650 Links: 2 Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root) ... // 文件有相同的 inode 号以及 data block # link old.file hard.link | ls -li total 8 660650 -rw-r--r-- 2 root root 25 Sep 1 17:44 hard.link 660650 -rw-r--r-- 2 root root 25 Sep 1 17:44 old.file // 不能交叉文件系统 # ln /dev/input/event5 /root/bfile.txt ln: failed to create hard link `/root/bfile.txt' => `/dev/input/event5': Invalid cross-device link // 不能对目录进行建立硬链接 # mkdir -p old.dir/test # ln old.dir/ hardlink.dir ln: `old.dir/': hard link not allowed for directory # ls -iF 660650 hard.link 657948 old.dir/ 660650 old.file
文件 old.file 与 hard.link 有着相同的 inode 号:660650 及文件权限,inode 是随着文件的存在而存在,所以只有当文件存在时才能够建立硬连接,即当inode 存在且连接计数器(link count)不为 0 时。inode 号仅在各文件系统下是惟一的,当 Linux 挂在多个文件系统后将出现 inode 号重复的现象,以下图所示,文件 t3.jpg,sync,及123.txt 并没有关联,却有着相同的 inode 号,所以硬连接建立是不可跨文件系统的。设备文件目录/dev 使用的文件系统是 devtmpfs ,而 /root 使用的是磁盘文件系统 ext4。下图展现了使用命令 df 查看当前系统中挂载的文件系统类型,各文件系统 inode 使用状况及文件系统挂载点。bash
查找有相同 inode 号的文件网络
# df -i --print-type Filesystem Type Inodes IUsed IFree IUse% Mounted on /dev/sda7 ext4 3147760 283483 2864277 10% / udev devtmpfs 496088 553 495535 1% /dev tmpfs tmpfs 499006 491 498515 1% /run none tmpfs 499006 3 499003 1% /run/lock none tmpfs 499006 15 498991 1% /run/shm /dev/sda6 fuseblk 74383900 4786 74379114 1% /media/DiskE /dev/sda8 fuseblk 29524592 19939 29504653 1% /media/DiskF # find / -inum 1114 /media/DiskE/Pictures/t3.jpg /media/DiskF/123.txt /bin/sync
值得一提的是,Linux 系统存在 inode 号被用完但磁盘空间还有剩余的状况。咱们建立一个5M大小的ext4类型的mo.img文件,并将其挂载至/mnt。而后咱们使用一个shell脚本将其挂载在 /mnt 下ext4文件系统的inode 耗尽,下图架构
# dd if=/dev/zero of=mo.img bs=5120k count=1 # ls -lh mo.img -rw-r--r-- 1 root root 5.0M Sep 1 17:54 mo.img # mkfs -t ext4 -F ./mo.img ... OS type: Linux Block size=1024 (log=0) Fragment size=1024 (log=0) Stride=0 blocks, Stripe width=0 blocks 1280 inodes, 5120 blocks 256 blocks (5.00%) reserved for the super user ... ... Writing superblocks and filesystem accounting information: done # mount -o loop ./mo.img /mnt # cat /mnt/inode_test.sh #!/bin/bash for ((i = 1; ; i++)) do if [ $? -eq 0 ]; then echo "This is file_$i" > file_$i else exit 0 fi done # ./inode_test.sh ./inode_test.sh: line 6: file_1269: No space left on device # df -iT /mnt/; du -sh /mnt/ Filesystem Type Inodes IUsed IFree IUse% Mounted on /dev/loop0 ext4 1280 1280 0 100% /mnt 1.3M /mnt/
硬连接不能对目录建立是受限于文件系统的设计。现 Linux 文件系统中的目录均隐藏了两个特殊的目录:当前目录(.)与父目录(..)。查看这两个特殊目录的 inode 号可知其实这两目录就是两个硬连接(注意目录 /mnt/lost+found/ 的 inode 号)。若系统容许对目录建立硬连接,则会产生目录环。并发
# ls -aliF /mnt/lost+found total 44 11 drwx------ 2 root root 12288 Sep 1 17:54 ./ 2 drwxr-xr-x 3 root root 31744 Sep 1 17:57 ../ # stat /mnt/lost+found/ File: `/mnt/lost+found/' Size: 12288 Blocks: 24 IO Block: 1024 directory Device: 700h/1792d Inode: 11 Links: 2 Access: (0700/drwx------) Uid: ( 0/ root) Gid: ( 0/ root) Access: 2012-09-01 17:57:17.000000000 +0800 Modify: 2012-09-01 17:54:49.000000000 +0800 Change: 2012-09-01 17:54:49.000000000 +0800 Birth: -
软连接与硬连接不一样,若文件用户数据块中存放的内容是另外一个文件的路径名的指向,则该文件就是软连接。软连接就是一个普通文件,只是数据库内容有点特殊。软连接有着本身的 inode 号以及用户数据块。所以软连接的建立与使用没有相似硬连接的诸多限制:
软连接的访问
# ls -li total 0 // 可对不存在的文件建立软连接 # ln -s old.file soft.link # ls -liF total 0 789467 lrwxrwxrwx 1 root root 8 Sep 1 18:00 soft.link -> old.file // 因为被指向的文件不存在,此时的软连接 soft.link 就是死连接 # cat soft.link cat: soft.link: No such file or directory // 建立被指向的文件 old.file,soft.link 恢复成正常的软连接 # echo "This is an original file_A" >> old.file # cat soft.link This is an original file_A // 对不存在的目录建立软连接 # ln -s old.dir soft.link.dir # mkdir -p old.dir/test # tree . -F --inodes . ├── [ 789497] old.dir/ │ └── [ 789498] test/ ├── [ 789495] old.file ├── [ 789495] soft.link -> old.file └── [ 789497] soft.link.dir -> old.dir/
固然软连接的用户数据也能够是另外一个软连接的路径,其解析过程是递归的。但需注意:软连接建立时原文件的路径指向使用绝对路径较好。使用相对路径建立的软连接被移动后该软连接文件成为死连接
$ ls -li total 2136 656627 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 a -> data.txt 656662 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 b -> a 656228 -rw------- 1 harris harris 2186738 Sep 1 14:37 data.txt 6
连接相关命令
在 Linux 中查看当前系统已挂着的文件系统类型除上述使用命令df ,还可使用命令 mount 或查看文件 /proc/mounts
# mount /dev/sda7 on / type ext4 (rw,errors=remount-ro) proc on /proc type proc (rw,noexec,nosuid,nodev) sysfs on /sys type sysfs (rw,noexec,nosuid,nodev) ... ... none on /run/shm type tmpfs (rw,nosuid,nodev)
命令 ls 或 stat 可帮助咱们区分软连接与其余文件并查看文件 inode 号,但较好的方式仍是使用 find 命令,其不只可查找某文件的软连接,还能够用于查找相同 inode 的全部硬连接
// 查找在路径 /home 下的文件 data.txt 的软连接 # find /home -lname data.txt /home/harris/debug/test2/a // 查看路径 /home 有相同 inode 的全部硬连接 # find /home -samefile /home/harris/debug/test3/old.file /home/harris/debug/test3/hard.link /home/harris/debug/test3/old.file # find /home -inum 660650 /home/harris/debug/test3/hard.link /home/harris/debug/test3/old.file // 列出路径 /home/harris/debug/ 下的全部软连接文件 # find /home/harris/debug/ -type l -ls 656662 0 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 /home/harris/debug/test2/b -> a 656627 0 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 /home/harris/debug/test2/a -> data.txt 789467 0 lrwxrwxrwx 1 root root 8 Sep 1 18:00 /home/harris/debug/test/soft.link -> old.file 789496 0 lrwxrwxrwx 1 root root 7 Sep 1 18:01 /home/harris/debug/test/soft.link.dir -> old.dir
系统根据磁盘的大小默认设定了 inode 的值,如若必要,可在格式文件系统前对该值进行修改。如键入命令 mkfs -t ext4 -I 512/dev/sda4 ,将使磁盘设备 /dev/sda4 格式成 inode 大小是 512 字节的 ext4文件系统。
// 查看磁盘分区 /dev/sda7 上的 inode 值 # dumpe2fs -h /dev/sda7 | grep "Inode size" dumpe2fs 1.42 (29-Nov-2011) Inode size: 256 # tune2fs -l /dev/sda7 | grep "Inode size" Inode size: 256
Linux VFS
Linux 有着极其丰富的文件系统,大致上可分以下几类:
实现以上这些文件系统并在Linux 下共存的基础就是 Linux VFS (Virtual File System 又称 Virtual Filesystem Switch),即虚拟文件系统。VFS 做为一个通用的文件系统,抽象了文件系统的四个基本概念:文件,目录项(dentry),索引节点(inode)即挂载点,其在内核中为用户空间层的文件系统提供了相关接口。VFS实现了 open(),read() 等系统调用使得cp等用户空间程序可跨文件系统。VFS真正实现了上述内容中:在Linux 中除进程以外一切皆是文件。
VFS 在系统中的架构
Linux VFS 存在四个基本对象:超级块对象(superblock object),索引节点对象(inode object),目录项对象(dentry object)及文件对象(file object)。超级块对象表明一个已安装的文件系统;索引节点对象表明一个文件;目录项对象表明一个目录项,如设备文件 event5 在路径 /dev/input/event5 中,其存在四个目录项对象:/、dev/、input/、event5。文件对象表明由进程打开的文件。这四个对象与进程及磁盘文件建的关系以下图,其中 d_inode 即为硬连接。为文件路径的快速解析,Linux VFS 设计了目录项缓存(Directory EntryCach,即 dcache)。
VFS的对象之间的处理
Linux 文件系统中的 inode
在 Linux 中,索引节点结构存在于系统内存及磁盘,其可区分红 VFS inode 与实际文件系统的 inode。VFS inode 做为实际文件系统中 inode 的抽象,定义告终构体 inode 与其相关的操做 inode_operations
VFS 中的 inode 与 inode_operations 结构体
struct inode { ... const struct inode_operations *i_op; // 索引节点操做 unsigned long i_ino; //索引节点号 atomic_t i_count; //引用计数器 unsigned int i_nlink; // 硬连接数码 ... } struct inode_operationis { ... int (*create) (struct inode *, struct dentry *, int struct nameidata *); int (*link) (struct dentry *, struct inode *, struct dentry *); int (*unlink) (struct inode *, struct dentry *); int (*synlink) (struct inode *, struct dentry *, const char *); int (*mkdir) (struct inode *,struct dentry *,int); int (*rmdir) (struct inode *,struct dentry *); ... }
如上图所见,每一个文件存在两个计数器:i_count 与 i_nlink,即引用计数与硬连接计数。结构体 inode 中的 i_count 用于跟踪文件被访问的数量,而 i_nlink 则是上述使用 ls -l 等命令查看到的文件硬连接数。或者说 i_count 跟踪文件在内存中的状况,而 i_nlink 则是磁盘计数器。当文件被删除时,则 i_nlink 先被设置成0,文件的这个两个计数器使得Linux 系统升级或程序更新变得容易。系统或程序可在不关闭的状况下(即文件 i_count 不为 0 ),将新文件已一样的文件名进行替换,新的文件有本身的 inode 及 data block,旧文件会在相关进程关闭后被完整的删除。
文件系统 ext4 中的 inode
struct ext_inode { ... __le32 i_atime; // 文件内容最后一次访问的时间 __le32 i_ctime; // inode修改时间 __le32 i_mtime; // 文件内容最后一次修改时间 __le16 i_links_count; // 硬连接计数 __le32 i_block2_lo; // Block 计数 __le32 i_block[EXT$_N_BLOCKS]; // 指向具体的block ... };
上图展现的是文件系统 ext4 中对 inode 的定义(见内核源码 fs/ext4/ext4.h)。其中三个时间的定义可对应于命令 stat 中看到三个时间。i_links_count 不只用于文件的硬连接计数,也用于目录数跟踪(目录并不显示硬连接数, 命令 ls -ld 查看到的是子目录数)。因为文件系统 ext3 对i_links_count 有限制,其最大数为:32000(该限制在 ext4 中被取消)。
结束语
本文最初描述了 Linux 系统中文件与目录被引入的缘由及 Linux 处理文件的方式,而后咱们经过区分硬连接与软连接的不一样,了解 Linux 中的索引节点的相关知识,并以此引出了 inode 的结构体。索引节点结构体存在于 Linux VFS 以及实际文件系统中,VFS 做为通用文件模型是 Linux 中 “一切皆是文件” 的实现的基础。文章并未深刻 Linux VFS ,也没有涉及实际文件系统的实现,文章只是从 inode 了解 Linux 的文件系统的相关内容。若想深刻文件系统的内容,查看内核文档 Documentation/filesystems/。