让咱们开始使用它。php
awk
是用于 Unix 和类 Unix 系统的强大文本解析工具,可是因为它有可编程函数,所以你能够用它来执行常规解析任务,所以它也被视为一种编程语言。你可能不会使用 awk
开发下一个 GUI 应用,而且它可能不会代替你的默认脚本语言,可是它是用于特定任务的强大程序。linux
这些任务或许是惊人的多样化。了解 awk
能够解决你的哪些问题的最好方法是学习 awk
。你会惊讶于 awk
如何帮助你完成更多工做,却花费更少的精力。git
awk
的基本语法是:github
awk [options] 'pattern {action}' file
复制代码
首先,建立此示例文件并将其保存为 colours.txt
。正则表达式
name color amount
apple red 4
banana yellow 6
strawberry red 3
grape purple 10
apple green 8
plum purple 2
kiwi brown 4
potato brown 9
pineapple yellow 5
复制代码
数据被一个或多个空格分隔为列。以某种方式组织要分析的数据是很常见的。它不必定老是由空格分隔的列,甚至能够不是逗号或分号,但尤为是在日志文件或数据转储中,一般有一个可预测的格式。你可使用数据格式来帮助 awk
提取和处理你关注的数据。编程
在 awk
中,print
函数显示你指定的内容。你可使用许多预约义的变量,可是最多见的是文本文件中以整数命名的列。试试看:bash
$ awk '{print $2;}' colours.txt
color
red
yellow
red
purple
green
purple
brown
brown
yellow
复制代码
在这里,awk
显示第二列,用 $2
表示。这是相对直观的,所以你可能会猜想 print $1
显示第一列,而 print $3
显示第三列,依此类推。app
要显示所有列,请使用 $0
。编程语言
美圆符号($
)后的数字是表达式,所以 $2
和 $(1+1)
是同一意思。函数
你使用的示例文件很是结构化。它有一行充当标题,而且各列直接相互关联。经过定义条件,你能够限定 awk
在找到此数据时返回的内容。例如,要查看第二列中与 yellow
匹配的项并打印第一列的内容:
awk '$2=="yellow"{print $1}' file1.txt
banana
pineapple
复制代码
正则表达式也能够工做。此表达式近似匹配 $2
中以 p
开头跟上任意数量(一个或多个)字符后继续跟上 p
的值:
$ awk '$2 ~ /p.+p/ {print $0}' colours.txt
grape purple 10
plum purple 2
复制代码
数字能被 awk
天然解释。例如,要打印第三列包含大于 5 的整数的行:
awk '$3>5 {print $1, $2}' colours.txt
name color
banana yellow
grape purple
apple green
potato brown
复制代码
默认状况下,awk
使用空格做为字段分隔符。可是,并不是全部文本文件都使用空格来定义字段。例如,用如下内容建立一个名为 colours.csv
的文件:
name,color,amount
apple,red,4
banana,yellow,6
strawberry,red,3
grape,purple,10
apple,green,8
plum,purple,2
kiwi,brown,4
potato,brown,9
pineapple,yellow,5
复制代码
只要你指定将哪一个字符用做命令中的字段分隔符,awk
就能以彻底相同的方式处理数据。使用 --field-separator
(或简称为 -F
)选项来定义分隔符:
$ awk -F"," '$2=="yellow" {print $1}' file1.csv
banana
pineapple
复制代码
使用输出重定向,你能够将结果写入文件。例如:
$ awk -F, '$3>5 {print $1, $2} colours.csv > output.txt 复制代码
这将建立一个包含 awk
查询内容的文件。
你还能够将文件拆分为按列数据分组的多个文件。例如,若是要根据每行显示的颜色将 colours.txt
拆分为多个文件,你能够在 awk
中包含重定向语句来重定向每条查询:
$ awk '{print > $2".txt"}' colours.txt
复制代码
这将生成名为 yellow.txt
、red.txt
等文件。
在下一篇文章中,你将了解有关字段,记录和一些强大的 awk 变量的更多信息。
本文改编自社区技术播客 Hacker Public Radio。
via: opensource.com/article/19/…
做者:Seth Kenlon 选题:lujun9972 译者:geekpi 校对:wxy