回到:linux
awk能够经过print、printf将数据输出到标准输出或重定向到文件。shell
print elem1,elem2,elem3... print(elem1,elem2,elem3...)
逗号分隔要打印的字段列表,各字段都会自动转换成字符串格式,而后经过预约义变量OFS(output field separator)的值(其默认值为空格)链接各字段进行输出。bash
$ awk 'BEGIN{print "hello","world"}' hello world $ awk 'BEGIN{OFS="-";print "hello","world"}' hello-world
print要输出的数据称为输出记录,在print输出时会自动在尾部加上输出记录分隔符,输出记录分隔符的预约义变量为ORS,其默认值为\n
。异步
$ awk 'BEGIN{OFS="-";ORS="_\n";print "hello","world"}' hello-world_
括号可省略,但若是要打印的元素中包含了特殊符号>
,则必须使用括号包围(如print("a" > "A")
),由于它是输出重定向符号。3d
若是省略参数,即print;
等价于print $0;
。code
print在输出数据时,老是会先转换成字符串再输出。orm
对于数值而言,能够自定义转换成字符串的格式,例如使用sprintf()进行格式化。blog
print在自动转换数值(专指小数)为字符串的时候,采用预约义变量OFMT(Output format)定义的格式按照sprintf()相同的方式进行格式化。OFMT默认值为%.6g
,表示有效位(整数部分加小数部分)最多为6。字符串
$ awk 'BEGIN{print 3.12432623}' 3.12433
能够修改OFMT,来自定义数值转换为字符串时的格式:get
$ awk 'BEGIN{OFMT="%.2f";print 3.99989}' 4.00 # 格式化为整数 $ awk 'BEGIN{OFMT="%d";print 3.99989}' 3 $ awk 'BEGIN{OFMT="%.0f";print 3.99989}' 4
printf format, item1, item2, ...
格式化字符:
修饰符:均放在格式化字符的前面
N$ N是正整数。默认状况下,printf的字段列表顺序和格式化字符 串中的%号顺序是一一对应的,使用N$能够自行指定顺序。 printf "%2$s %1$s","world","hello"输出hello world N$能够重复指定,例如"%1$s %1$s"将取两次第一个字段 宽度 指定该字段占用的字符数量,不足宽度默认使用空格填充,超出宽度将无视。 printf "%5s","ni"输出"___ni",下划线表示空格 - 表示左对齐。默认是右对齐的。 printf "%5s","ni"输出"___ni" printf "%-5s","ni"输出"ni___" 空格 针对于数值。对于正数,在其前添加一个空格,对于负数,无视 printf "% d,% d",3,-2输出"_3,-2",下划线表示空格 + 针对于数值。对于正数,在其前添加一个+号,对于负数,无视 printf "%+d,%+d",3,-2输出"+3,-2",下划线表示空格 # 可变的数值前缀。对于%o,将添加前缀0,对于%x或%X,将添加前缀0x或0X 0 只对数值有效。使用0而非默认的空格填充在左边,对于左对齐的数值无效 printf "%05d","3"输出00003 printf "%-05d","3"输出3 printf "%05s",3输出____3 ' 单引号,表示对数值加上千分位逗号,只对支持千分位表示的locale有效 $ awk "BEGIN{printf \"%'d\n\",123457890}" 123,457,890 $ LC_ALL=C awk "BEGIN{printf \"%'d\n\",123457890}" 123457890 .prec 指定精度。在不一样格式化字符下,精度含义不一样 %d,%i,%o,%u,%x,%X 的精度表示最大数字字符数量 %e,%E,%f,%F 的精度表示小数点后几位数 %s 的精度表示最长字符数量,printf "%.3s","foob"输出foo %g,%G 的精度表示表示最大有效位数,即整数加小数位的总数量
sprintf()采用和printf相同的方式格式化字符串,可是它不会输出格式化后的字符串,而是返回格式化后的字符串。因此,能够将格式化后的字符串赋值给某个变量。
awk ' BEGIN{ a = sprintf("%03d", 12.34) print a # 012 } '
print[f] something >"filename" print[f] something >>"filename" print[f] something | "Shell_Cmd" print[f] something |& "Shell_Cmd_Coprocess"
>filename
时,若是文件不存在,则建立,若是文件存在则首先截断。以后再输出到该文件时将再也不截断。
awk中只要不close(),任何文件都只会在第一次使用时打开,以后都不会再从新打开。
awk '{print $2 >"name.txt";print $4 >"name.txt"}' a.txt
>>filename
时,将追加数据,文件不存在时则建立。
print[f] something | Shell_Cmd
时,awk将建立一个管道,而后启动Shell命令,print[f]产生的数据放入管道,而命令将从管道中读取数据。
# 例1: awk ' NR>1{ print $2 >"name.unsort" cmd = "sort >name.sort" print $2 | cmd #print $2 | "sort >name.sort" } END{close(cmd)} ' a.txt # 例2:awk中构建Shell命令,经过管道交给shell执行 awk 'BEGIN{printf "seq 1 5" | "bash"}'
print[f] something |& Shell_Cmd
时,print[f]产生的数据交给Coprocess。以后,awk再从Coprocess中取回数据。这里的|&
有点相似于可以让Shell_Cmd后台异步运行的管道。
awk重定向时能够直接使用/dev/stdin
、/dev/stdout
和/dev/stderr
。还能够直接使用某个已打开的文件描述符/dev/fd/N
。
例如:
awk 'BEGIN{print "something OK" > "/dev/stdout"}' awk 'BEGIN{print "something wrong" > "/dev/stderr"}' awk 'BEGIN{print "something wrong" | "cat >&2"}' awk 'BEGIN{getline < "/dev/stdin";print $0}' $ exec 4<> a.txt $ awk 'BEGIN{while((getline < "/dev/fd/4")>0){print $0}}'