利用linux命令行工具进行文本行过滤

时间 2019-12-04

原文原文链接

在平常工做中会遇到须要筛选过滤要查看的日志等文本文件的任务，例如须要查看日志文件的最后几行等。下面总结一下常见的对文本行过滤的方法。linux

经常使用命令行工具

接下来主要使用的是head，tail，sed和awk，这几个工具。其中sed和awk工具很是强大，使用它们来进行文本的过滤可能有点大材小用，不过基本上全部的任务均可以经过head和tail两个命令来完成，并且head和tail平常使用更加方便。工具

用法示例

准备工做

输入下面命令，生成一个测试用的文件。测试

$ seq -f "Line No %g" 10 > lines.txt

只显示文本的前3行

能够经过head命令来完成，具体命令和输出以下：命令行

$ head -n 3 lines.txt
Line No 1
Line No 2
Line No 3

或者经过sed命令来完成，具体命令和输出以下：日志

$ sed -n '1,3p' lines.txt
Line No 1
Line No 2
Line No 3

awk命令也能够完成code

$ awk 'NR<=3' lines.txt
Line No 1
Line No 2
Line No 3

只显示文本的最后3行

使用tail命令来完成，具体命令和输出以下：awk

$ tail -n 3 lines.txt
Line No 8
Line No 9
Line No 10

只显示文本的第5行到最后1行

使用tail命令来完成的方法：sed

$ tail -n +5 lines.txt
Line No 5
Line No 6
Line No 7
Line No 8
Line No 9
Line No 10

sed命令来完成：方法

$ sed -n '5,$p' lines.txt
Line No 5
--略--
Line No 10

用awk来完成：总结

$ awk 'NR>=5' lines.txt
Line No 5
--略--
Line No 10

只显示文本的倒数第3行到第1行

用head来完成：

$ head -n -2 lines.txt
Line No 1
Line No 2
Line No 3
Line No 4
Line No 5
Line No 6
Line No 7
Line No 8

只显示文本的第6行到第8行

用head和tail两个工具：

$ < lines.txt head -n 8 | tail -n 3
Line No 6
Line No 7
Line No 8

sed的方法：

$ sed -n '6,8p' lines.txt
Line No 6
Line No 7
Line No 8

awk的方法：

$ awk '(NR>=6)&&(NR<=8)' lines.txt
Line No 6
Line No 7
Line No 8

只显示文本奇数行或偶数行

sed命令生成奇数行

$ sed -n '1~2p' lines.txt
Line No 1
Line No 3
Line No 5
Line No 7
Line No 9

sed命令生成偶数行

$ sed -n '0~2p' lines.txt
Line No 2
Line No 4
Line No 6
Line No 8
Line No 10

awk命令生成奇数行

$ awk 'NR%2' lines.txt
Line No 1
Line No 3
Line No 5
Line No 7
Line No 9

awk命令生成偶数行

$ awk '(NR+1)%2' lines.txt
Line No 2
Line No 4
Line No 6
Line No 8
Line No 10

小结

linux系统的一个有名的特色是绝大多少文件都是文本文件，这些文件均可以经过上面的方法来查看特定的行。另外linux命令行工具也很是灵活，完成一件任务，不是只有一种方法，有不少方法能够实现，这也是linux好玩的地方。在文本过滤方面，sed和awk命令还有不少强大的用法，你们有兴趣的话能够深刻研究一下。

参考文献：

《命令行中的数据科学》 Jeroen Janssens著