linux: 文件系统基础知识

转载: http://linux.cn/blog-15563-5821.htmlhtml

 

linux文件系统基础知识node

下面是有关linux文件系统知识的学习笔记:linux

一、linux文件系统分配策略:算法

    块分配( block allocation ) 和 扩展分配  ( extent allocation )数据库

    块分配:磁盘上的文件块根据须要分配给文件,避免了存储空间的浪费。但当文件扩充时,会形成文数组


件中文件块的不连续,从而致使过多的磁盘寻道时间。安全

            每一次文件扩展时,块分配算法就须要写入文件块的结构信息,也就是 meta-dada 。meta-服务器


data老是与文件一块儿写入存储设备,改变文件的操做要等到全部meta-data的操做都完成后才能进行,网络

            所以,meta-data的操做会明显下降整个文件系统的性能。数据结构

    扩展分配: 文件建立时,一次性分配一连串连续的块,当文件扩展时,也一次分配不少块。meta-


data在文件建立时写入,当文件大小没有超过全部已分配文件块大小时,就不用写入meta-data,直到须要


再分配文件块的时候。

                扩展分配采用成组分配块的方式,减小了SCSI设备写数据的时间,在读取顺序文件时具


有良好的性能,但随机读取文件时,就和块分配相似了。

                文件块的组或块簇 ( block cluster) 的大小是在编译时肯定的。簇的大小对文件系统


的性能有很大的影响。

    注: meta-data 元信息:和文件有关的信息,好比权限、全部者以及建立、访问或更改时间等。

二、文件的记录形式

    linux文家系统使用索引节点(inode)来记录文件信息。索引节点是一种数据结构,它包含了一个文件


的长度、建立及修改时间、权限、所属关系、磁盘中的位置等信息。

一个文件系统维护了一个索引节点的数组,每一个文件或目录都与索引节点数组中的惟一的元素对应。每一个


索引节点在数组中的索引号,称为索引节点号。

    linux文件系统将文件索引节点号和文件名同时保存在目录中,因此,目录只是将文件的名称和它的索


引节点号结合在一块儿的一张表,目录中每一对文件名称和索引节点号称为一个链接。

对于一个文件来讲,有一个索引节点号与之对应;而对于一个索引节点号,却能够对应多个文件名。

    链接分为软链接和硬链接,其中软链接又叫符号链接。

    硬链接: 原文件名和链接文件名都指向相同的物理地址。目录不能有硬链接;硬链接不能跨文件系统


(不能跨越不一样的分区),文件在磁盘中只有一个拷贝。

            因为删除文件要在同一个索引节点属于惟一的链接时才能成功,所以硬链接能够防止没必要要


的误删除。

    软链接: 用 ln -s 命令创建文件的符号链接。符号链接是linux特殊文件的一种,做为一个文件,它


的数据是它所链接的文件的路径名。没有防止误删除的功能。

三、文件系统类型:

    

    ext2 : 早期linux中经常使用的文件系统

    ext3 : ext2的升级版,带日志功能

    RAMFS : 内存文件系统,速度很快

    NFS : 网络文件系统,由SUN发明,主要用于远程文件共享

    MS-DOS : MS-DOS文件系统

    VFAT : Windows 95/98 操做系统采用的文件系统

    FAT : Windows XP 操做系统采用的文件系统

    NTFS : Windows NT/XP 操做系统采用的文件系统

    HPFS : OS/2 操做系统采用的文件系统

    PROC : 虚拟的进程文件系统

    ISO9660 : 大部分光盘所采用的文件系统

    ufsSun : OS 所采用的文件系统

    NCPFS : Novell 服务器所采用的文件系统

    SMBFS : Samba 的共享文件系统

    XFS : 由SGI开发的先进的日志文件系统,支持超大容量文件

    JFS :IBM的AIX使用的日志文件系统

    ReiserFS : 基于平衡树结构的文件系统

    udf: 可擦写的数据光盘文件系统

四、虚拟文件系统VFS

    

    linux支持的全部文件系统称为逻辑文件系统,而linux在传统的逻辑文件系统的基础上增长料一个蓄


念文件系统( Vitual File System ,VFS) 的接口层。

    虚拟文件系统(VFS) 位于文件系统的最上层,管理各类逻辑文件系统,并能够屏蔽各类逻辑文件系统


之间的差别,提供统一文件和设备的访问接口。

五、文件的逻辑结构

    文件的逻辑结构可分为两大类: 字节流式的无结构文件 和 记录式的有结构文件。

    由字节流(字节序列)组成的文件是一种无结构文件或流式文件 ,不考虑文件内部的逻辑结构,只是


简单地看做是一系列字节的序列,便于在文件的任意位置添加内容。

    由记录组成的文件称为记录式文件 ,记录是这种文件类型的基本信息单位,记录式文件通用于信息管


理。

六、文件类型

    

    普通文件 : 一般是流式文件

    目录文件 : 用于表示和管理系统中的所有文件

    链接文件 : 用于不一样目录下文件的共享

    设备文件 : 包括块设备文件和字符设备文件,块设备文件表示磁盘文件、光盘等,字符设备文件按


照字符操做终端、键盘等设备。

    管道(FIFO)文件 :  提供进程建通讯的一种方式

    套接字(socket) 文件: 该文件类型与网络通讯有关

七、文件结构: 包括索引节点和数据

    索引节点 : 又称 I 节点,在文件系统结构中,包含有关相应文件的信息的一个记录,这些信息包括


文件权限、文件名、文件大小、存放位置、创建日期等。文件系统中全部文件的索引节点保存在索引节点


表中。

    数据  : 文件的实际内容。能够是空的,也能够很是大,而且拥有本身的结构。

八、ext2文件系统

    

    ext2文件系统的数据块大小通常为 1024B、2048B 或 4096B

    ext2文件系统采用的索引节点(inode):

        索引节点采用了多重索引结构,主要体如今直接指针和3个间接指针。直接指针包含12个直接指针


块,它们直接指向包含文件数据的数据块,紧接在后面的3个间接指针是为了适应文件的大小变化而设计的


    e.g: 假设数据块大小为1024B ,利用12个直接指针,能够保存最大为12KB的文件,当文件超过12KB


时,则要利用单级间接指针,该指针指向的数据块保存有一组数据块指针,这些指针依次指向包含有实际


数据的数据块,

        假如每一个指针占用4B,则每一个单级指针数据块可保存 1024/4=256 个数据指针,所以利用直接指


针和单级间接指针可保存 1024*12+1024*256=268 KB的文件。当文件超过268KB时,再利用二级间接指针


,直到使用三级间接指针。

        利用直接指针、单级间接指针、二级间接指针、三级间接指针可保存的最大文件大小为:

            1024*12+1024*256+1024*256*256+1024*256*256*256=16843020 KB,约 16GB

        若数据块大小为2048B,指针占4B,则最大文件大小为: 


2048*12+2048*512+2048*512*512+2048*512*512*512=268,960,792 KB 约 268GB

        若数据块大小为4096B,指针占4B,则最大文件大小为: 


4096*12+4096*1024+4096*1024*1024+4096*1024*1024*1024=4,299,165,744 KB ,约 4TB

    注: 命令 tune2fs -l /dev/sda5  可查看文件系统

    ext2文件系统最大文件名长度: 255个字符

    

    ext2文件系统的缺点: 

            ext2在写入文件内容的同时并无同时写入文件meta-data,    其工做顺序是先写入文件的


内容,而后等空闲时候才写入文件的meta-data。若发生意外,则文件系统就会处于不一致状态。

        在从新启动系统的时候,linux会启动 fsk ( file system check) 的程序,扫描整个文件系统并


试图修复,但不提供保证。

九、ext3文件系统:

    

    ext3基于ext2的代码,因此磁盘格式与ext2相同,使用相同的元数据。

    ext2文件系统无损转化为ext3文件系统:  tune2fs  -j /dev/sda6

    

    日志块设备( Journaling block device layer,JBD)完成ext3文件系统日志功能。JBD不是ext3文件系


统所特有的,它的设计目标是为了向一个块设备添加日志功能。

    当一个文件修改执行时,ext3文件系统代码将通知JBD,称为一个事务(transaction)。发生意外时,


日志功能具备的重放功能,能从新执行中断的事务。

    

    日志中的3种数据模式:

        1)、data=writeback :不处理任何形式的日志数据,给用户总体上的最高性能

        2)、data=odered :只记录元数据日志,但将元数据和数据组成一个单元称为事务(transaction) 


。此模式保持所句句的可靠性与文件系统的一致性,性能远低于data=writeback模式,但比data=journal


模式快

        3)、data=journal :提供完整的数据及元数据日志,全部新数据首先被写入日志,而后才被定位


。意外发生事后,日志能够被重放,将数据与元数据带回一致状态。这种模式总体性能最慢,但数据须要


从磁盘读取和写入磁盘时倒是3种模式中最快的。

    ext3文件系统最大文件名长度: 255个字符

    ext3文件系统的优势:可用性、数据完整性、速度、兼容性

十、ReiserFS文件系统

    

    ReiserFS文件系统是由Hans Reiser和他领导的开发小组共同开发的,整个文件系统彻底是从头设计的


,是一个很是优秀的文件系统。也是最先用于Linux的日志文件系统之一。

    ReiserFS的特色

     先进的日志机制

        ReiserFS有先进的日志(Journaling/logging)功能 机制。日志机制保证了在每一个实际数据修改之


前,相应的日志已经写入硬盘。文件与数据的安全性有了很大提升。

     高效的磁盘空间利用

        Reiserfs对一些小文件不分配inode。而是将这些文件打包,存放在同一个磁盘分块中。而其它文


件系统则为每一个小文件分别放置到一个磁盘分块中。

     独特的搜寻方式

        ReiserFS基于快速平衡树(balanced tree)搜索,平衡树在性能上很是卓越,这是一种很是高效的


算法。ReiserFS搜索大量文件时,搜索速度要比ext2快得多。Reiserfs文件系统使用B*Tree存储文件,而


其它文件系统使用B+Tree树。B*Tree查询速度比B+Tree要快不少。Reiserfs在文件定位上速度很是快。

        在实际运用中,ReiserFS 在处理小于 4k 的文件时,比ext2 快 5 倍;带尾文件压缩功能(默认


)的ReiserFS 比ext2文件系统多存储6%的数据。

    支持海量磁盘

        ReiserFS是一个很是优秀的文件系统,一直被用在高端UNIX系统上,可轻松管理上百G的文件系统


,ReiserFS文件系统最大支持的文件系统尺寸为16TB。这很是适合企业级应用中。

    优异的性能

        因为它的高效存储和快速小文件I/O特色,使用ReiserFs文件系统的PC,在启动X窗口系统时,所


花的时间要比在同一台机器上使用ext2文件系统少1/3。另外,ReiserFS文件系统支持单个文件尺寸为4G的


文件,这为大型数据库系统在linux上的应用提供了更好的选择。

相关文章
相关标签/搜索