shell/bash 交集、并集、差集

时间 2020-02-02

标签 shell bash 交集栏目 Unix 繁體版

原文原文链接

方法一（直接用文件名）：取两个文本文件的并集、交集、差集
并:ide

sort -m <(sort file1 | uniq) <(sort file2 | uniq) | uniqspa

交:orm

sort -m <(sort file1 | uniq) <(sort file2 | uniq) | uniq -d排序

差 file1 - file2:ci

sort -m <(sort file1 | uniq) <(sort file2 | uniq) <(sort file2 | uniq) | uniq -uit

方法二（用变量参数）：取两个文本文件的并集、交集、差集
class

file1=XXXX变量

file2=YYYYfile

# 并:搜索

sort -m <(sort $file1 | uniq) <(sort $file2 | uniq) | uniq

# 交:

sort -m <(sort $file1 | uniq) <(sort $file2 | uniq) | uniq -d

# 差 file1 - file2:

sort -m <(sort $file1 | uniq) <(sort $file2 | uniq) <(sort $file2 | uniq) | uniq -u

方法三：

file1=XXXX

file2=YYYY

# 并:

cat $file1 $file2 | sort | uniq

# 交:

cat $file1 $file2 | sort | uniq -d

备注：

uniq -d 会输出重复行

uniq -u 只显示惟一的行

grep命令

grep命令是经常使用来搜索文本内容的，根据输入的pattern，输出命中的内容。能够利用它的文件输入pattern特性，来求两个文件的交集。

$ 
c
d
e

那差集能够利用-v这个参数，例如：

$ grep -F -v -f a.file b.file
f
g

$ grep -F -v -f b.file a.file
a
b

其中第一个命令求B-A，第二个命令求A-B

注意：

1）grep求交集不要求输入文件是排序的，但最好是惟一的

2）差集时注意输入文件的顺序