Linux下如何寻找相同文件?

你们好,我是良许。node

随着电脑的使用,系统里将产生不少垃圾,最典型的就是同一份文件被保存到了不一样的位置,这样致使的结果就是磁盘空间被大量占用,系统运行愈来愈慢。bash

因此若是你的电脑空间告急的话,能够试着去删除这样的文件,释放一些空间。在 Linux 下,咱们能够经过识别文件的 inode 值来找出系统中的相同文件。数据结构

inode 是一个数据结构,记录了文件全部信息,除了文件名和文件内容。若是两个或多个文件具备相同的 inode 值,即便它们的文件名不同,位置不同,它们的内容、全部者、权限其实都是同样的,咱们能够将其视有相同文件。code

这类型的文件其实就是所谓的「硬连接」。硬连接具备相同的 inode 值,但文件名不同。而软连接其实就是快捷方式,它指向目标文件,但有着本身的 inode 值。排序

$ ls -l my*
-rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 myfile
lrwxrwxrwx 1 liangxu liangxu     6 Apr 15 11:18 myref -> myfile
-rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 mytwin

咱们没法直接知道同一目录下有哪些文件是有相同的 inode 值,但要识别起来也不难。其实咱们只要使用 ls -i 命令,再以 inode 值进行排序,就能够直接找到这些文件。io

$ ls -i | sort -n | more
 ...
 788000 myfile	<==
 788000 mytwin	<==
 801865 Name_Labels.pdf
 786692 never leave home angry
 920242 NFCU_Docs
 800247 nmap-notes

在这个结果的第一列里,就是对应的 inode 值。因此从这个结果里咱们一眼就能够看出来,哪些文件具备相同 inode 值。pdf

若是你只是想找到一个文件的对应硬连接文件,咱们可使用 find 命令,再加个 -samefile 选项便可快速找到。awk

$ find . -samefile myfile
./myfile
./save/mycopy
./mytwin

这些文件都是有相同的 inode 值,不信的话能够再使用 ls 命令来查看更多信息:file

$ find . -samefile myfile -ls
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./myfile
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./save/mycopy
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./mytwin

咱们能够看到,除了文件名以外,这几个文件名的信息彻底同样。细心的朋友可能会注意到,在第2列(硬链接数)是4,而实际上咱们找出来的文件只有3个,这说明还有一个文件与他们共享 inode 值,只是咱们经过这条命令没有找出来而已。搜索

做为一个懒人,每次敲命令多麻烦,直接上脚本找出目录下的相同文件!

#!/bin/bash

# seaches for files sharing inodes

prev=""

# list files by inode
ls -i | sort -n > /tmp/$0

# search through file for duplicate inode #s
while read line
do
    inode=`echo $line | awk '{print $1}'`
    if [ "$inode" == "$prev" ]; then
        grep $inode /tmp/$0
    fi
    prev=$inode
done < /tmp/$0

# clean up
rm /tmp/$0

运行结果:

$ ./findHardLinks
 788000 myfile
 788000 mytwin

固然了,你还可使用 find 命令,根据 inode 值,找到系统里全部相同文件。

$ find / -inum 788000 -ls 2> /dev/null
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /tmp/mycopy
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/myfile
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/save/mycopy
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/mytwin

在这条命令里,咱们将错误提示重定向到 /dev/null 这个特殊文件里,这样在搜索一些咱们没有权限访问的路径时,不会满屏的 permission denied


公众号:良许Linux

有收获?但愿老铁们来个三连击,给更多的人看到这篇文章

相关文章
相关标签/搜索