咱们经常使用du和df来获取目录或文件系统已占用空间的状况。但它们的统计结果是不一致的,大多数时候,它们的结果相差不会很大,但有时候它们的统计结果会相差很是大。php
例如:html
[root@xuexi ~]# df -hT Filesystem Type Size Used Avail Use% Mounted on /dev/sda2 ext4 18G 1.7G 15G 11% / tmpfs tmpfs 491M 0 491M 0% /dev/shm /dev/sda1 ext4 239M 68M 159M 30% /boot //192.168.0.124/win cifs 381G 243G 138G 64% /mnt
[root@xuexi ~]# du -sh / 2>/dev/null 244G /
df中"/"的使用空间是1.7G,可是du的结果倒是244G。这里du的统计结果大于df。node
再看看对/boot分区的统计结果。linux
[root@xuexi ~]# df -hT /boot;echo;du -sh /boot Filesystem Type Size Used Avail Use% Mounted on /dev/sda1 ext4 239M 68M 159M 30% /boot 66M /boot
du的结果是66M,df的结果是68M,相差不大,但df的结果大于du。php-fpm
这里简单说明下文件系统相关的底层机制,首先说明下文件是怎么存储到文件系统中的。假如要存储a.txt到/tmp目录下。当a.txt文件要存储到/tmp下时:工具
当要删除a.txt文件时:spa
考虑一种状况,当一个文件被删除时,但此时还有进程在使用这个文件,这时是怎样的状况呢?外界是看不到也找不到这个文件的,因此删除的过程已经进行到了第(3)步。但进程还在使用这个文件的数据,也能找到这个文件的数据,是由于进程在加载这个文件的时候就已经获取到了该文件占用哪些data block,虽然删除了文件,但bmap中这些data block尚未标记为未使用。指针
du是经过stat命令来统计每一个文件(包括子目录)的空间占用总和。由于会对每一个涉及到的文件使用stat命令,因此速度较慢。code
1.若是统计目录下挂载了其余文件系统,那么也会对这个文件系统进行统计。htm
例如"du -sh /"的时候,会统计全部分区的文件,包括挂载上来的。正如本文开头统计的"/"同样,du的结果是244G,明显比df统计的结果大,就是由于将某个分区挂载到了/mnt目录下。
## df的统计结果 [root@xuexi ~]# df -hT Filesystem Type Size Used Avail Use% Mounted on /dev/sda2 ext4 18G 1.7G 15G 11% / tmpfs tmpfs 491M 0 491M 0% /dev/shm /dev/sda1 ext4 239M 68M 159M 30% /boot //192.168.0.124/win cifs 381G 243G 138G 64% /mnt ## du对根目录的统计结果 [root@xuexi ~]# du -sh / 2>/dev/null 244G /
2.若是文件被删除,即便被其余进程引用了,du命令也没法对其统计。由于stat命令找不到这个文件。
3.能够跨分区统计某些你想统计的文件大小总和。由于它们都能被stat找到并统计。
例如:
统计Linux下全部img文件的大小。
[root@xuexi ~]# find / -type f -name "*.img" -print0 | xargs -0 du -csh 19M /boot/initramfs-2.6.32-504.el6.x86_64.img 13M /mnt/linux工具/cirros-0.3.4-x86_64-disk.img 31M total
这里统计的两个img文件就是在不一样分区内的。
df是读取每一个分区的superblock来获取空闲数据块、已使用数据块,从而计算出空闲空间和已使用空间,所以df统计的速度极快(superblock才占用1024字节)。
1.当某个文件系统下挂载了其余分区,df不会把这个分区也统计进去。
这很容易理解,由于df读取的是各自分区的superblock,即便分区1挂载在分区0的目录下,df统计分区0的时候,也只能读取分区0的superblock。
例如,下面的/mnt、/boot都没有统计在"/"中。
[root@xuexi ~]# df -hT Filesystem Type Size Used Avail Use% Mounted on /dev/sda2 ext4 18G 1.7G 15G 11% / tmpfs tmpfs 491M 0 491M 0% /dev/shm /dev/sda1 ext4 239M 68M 159M 30% /boot //192.168.0.124/win cifs 381G 243G 138G 64% /mnt
2.因为df每次统计都是读取superblock,因此df对文件系统中的某个文件进行统计时,会自动转为统计这个文件系统的信息。
[root@xuexi ~]# df -hT /etc/fstab Filesystem Type Size Used Avail Use% Mounted on /dev/sda2 ext4 18G 1.7G 15G 11% /
3.df会统计已删除但却仍有进程引用的文件。
正常状况下,删除文件会马上释放相关指针,并将imap和bmap中相关的位图标记为未使用。bmap只要一改变,文件系统马上就能知道每一个块组中哪些数据块是空闲的,哪些数据块是被使用的,这些信息都会更新到分区的superblock中。因而df能马上统计到实时的空间信息。
可是当一个文件被删除时,若是还有进程在引用这个文件,根据前文的分析,bmap中不会将这个文件的data block标记为未使用,也就不会将数据块的使用状况更新到superblock中。因为df是根据superblock中空闲和使用数据块的数量来计算空闲空间和已使用空间的,因此df统计的时候会将这个已被"删除"的文件统计到已使用空间中。
例如,建立一个较大一点的文件放在"/"目录下,并du和df统计根目录的已使用空间。
[root@xuexi ~]# dd if=/dev/zero of=/my.iso bs=1M count=1000 [root@xuexi ~]# df -hT / Filesystem Type Size Used Avail Use% Mounted on /dev/sda2 ext4 18G 2.7G 14G 17% / [root@xuexi ~]# du -sh --exclude="/mnt" / 2>/dev/null 2.7G /
它们在GB级的单位上是相等的。
如今使用一个进程来引用这个文件,而后删除这个文件,再du和df统计。
[root@xuexi ~]# tail -f /my.iso & [root@xuexi ~]# rm -rf /my.iso [root@xuexi ~]# ls /my.iso ls: cannot access /my.iso: No such file or directory [root@xuexi ~]# du -sh --exclude="/mnt" / 2>/dev/null 1.8G / [root@xuexi ~]# df -hT / Filesystem Type Size Used Avail Use% Mounted on /dev/sda2 ext4 18G 2.7G 14G 17% /
能够发现,外界已经获取不到my.iso文件了,因此du没法统计这个文件。而df却将该文件大小统计进去了,由于my.iso占用的data block还未被标记为未使用。
再关掉tail进程,而后df再统计空间,结果将和du同样显示为正常的大小。
[root@xuexi ~]# jobs [1]+ Running tail -f /my.iso & [root@xuexi ~]# kill %1 [root@xuexi ~]# df -hT / Filesystem Type Size Used Avail Use% Mounted on /dev/sda2 ext4 18G 1.7G 15G 11% /
若是不知道文件系统中哪些已被删除,但却还被进程引用的文件,可使用lsof来获取。经过它还能获取到文件的大小,看看究竟是哪一个文件在"占着茅坑以及占了多少茅坑"。
例如,关掉tail进程前,使用lsof查看。能够看到tail进程占用了/my.iso,且这个文件的大小为1048576000字节。
[root@xuexi ~]# lsof | grep deleted php-fpm 12597 root txt REG 8,2 4058416 931143 /usr/sbin/php-fpm (deleted) php-fpm 12657 nobody txt REG 8,2 4058416 931143 /usr/sbin/php-fpm (deleted) php-fpm 12707 nobody txt REG 8,2 4058416 931143 /usr/sbin/php-fpm (deleted) php-fpm 12708 nobody txt REG 8,2 4058416 931143 /usr/sbin/php-fpm (deleted) tail 14437 root 3r REG 8,2 1048576000 7171 /my.iso (deleted)
通过上面的分析,想必对du和df的结果不会再有任何疑惑了吧。
做者:骏马金龙
来源:https://www.cnblogs.com/f-ck-...