awk介绍 awk基本用法 awk变量 awk格式化 awk操做符 awk条件判断 awk循环 awk数组 awk函数 调用系统命令
AWK介绍linux
awk:Aho, Weinberger, Kernighan,报告生成器,格式化文本输出 有多种版本:New awk(nawk),GNU awk( gawk) gawk:模式扫描和处理语言 基本用法: awk [options] ‘program’ var=value file… awk [options] -f programfile var=value file… awk [options] 'BEGIN{ action;… } pattern{ action;… } END{ action;… }' file ... awk 程序一般由:BEGIN语句块、可以使用模式匹配的通用语句块、END语句块,共3部 分组成 program一般是被单引号或双引号中 选项: -F 指明输入时用到的字段分隔符 -v var=value: 自定义变量
AWK语言正则表达式
基本格式:awk [options] 'program' file… program:pattern{action statements;..} pattern和action: • pattern部分决定动做语句什么时候触发及触发事件 BEGIN,END • action statements对数据进行处理,放在{}内指明 print, printf 分割符、域和记录 • awk执行时,由分隔符分隔的字段(域)标记$1,$2..$n称为域标识。$0为全部域, 注意:和shell中变量$符含义不一样 • 文件的每一行称为记录 • 省略action,则默认执行 print $0 的操
awk工做原理shell
第一步:执行BEGIN{action;… }语句块中的语句 第二步:从文件或标准输入(stdin)读取一行,而后执行pattern{ action;… }语句块,它 逐行扫描文件,从第一行到最后一行重复这个过程,直到文件所有被读取完毕。 第三步:当读至输入流末尾时,执行END{action;…}语句块 BEGIN语句块在awk开始从输入流中读取行以前被执行,这是一个可选的语句块,好比 变量初始化、打印输出表格的表头等语句一般能够写在BEGIN语句块中 END语句块在awk从输入流中读取完全部的行以后即被执行,好比打印全部行的分析 结果这类信息汇总都是在END语句块中完成,它也是一个可选语句块 pattern语句块中的通用命令是最重要的部分,也是可选的。若是没有提供pattern语句 块,则默认执行{ print },即打印每个读取到的行,awk读取的每一行都会执行该语句块
AWKexpress
print格式: print item1, item2, ... 要点: (1) 逗号分隔符 (2) 输出的各item能够字符串,也能够是数值;当前记录的字段、变量或awk的表达式 (3) 如省略item,至关于print $0 示例: awk '{print "hello,awk"}' awk –F: '{print}' /etc/passwd awk –F: ‘{print “wang”}’ /etc/passwd awk –F: ‘{print $1}’ /etc/passwd awk –F: ‘{print $0}’ /etc/passwd awk –F: ‘{print $1”\t”$3}’ /etc/passwd【"\t" 表明一个tab键】 tail –3 /etc/fstab |awk ‘{print $2,$4}’ df |sed '1d' |awk -F "[ %]+" '{print $5}' 【取用的百分比, “[ %]+” 说明他支持扩展正则表达式】 例:[root@centos7 04:41:20 ~]#df |grep "/dev/sd" |awk -F " +|%" '{print $1,$5}' /dev/sda2 8 /dev/sda5 1 /dev/sda1 17 [root@centos7 04:41:26 ~]#df |grep "/dev/sd" |awk -F "[ %]+" '{print $1,$5}' /dev/sda2 8 /dev/sda5 1 /dev/sda1 17 [root@centos23:10:50bin]#df |awk -F " +|%" '$0 ~ /^\/dev\/sd/ {print $1,$5}'
AWK变量centos
变量:内置和自定义变量 FS:输入字段分隔符,默认为空白字符 awk -v FS=':' '{print $1,FS,$3}’ /etc/passwd awk –F: '{print $1,$3,$7}’ /etc/passwd、 例: 在shell中定义一个变量 fs=: awk -v FS=$fs '{print $1FS$2}' /etc/passwd OFS:输出字段分隔符,默认为空白字符 awk -v FS=‘:’ -v OFS=‘:’ '{print $1,$3,$7}’ /etc/passwd awk -v FS=: -v OFS="\n" '{print $1,$3}' /etc/passwd awk -v FS=: -v OFS="=====" '{print $1,$3}' /etc/passwd RS:输入记录分隔符,指定输入时的换行符 awk -v RS=' ' ‘{print }’ /etc/passwd 例:[root@centos7 03:53:52 ~]#cat f1.txt a,d,c;1,2,3,4;A,B,C aa,bb,dd [root@centos7 03:53:54 ~]#awk -v FS=',' -v RS=";" '{print $3,$4}' f1.txt c 3 4 C aa bb [root@centos7 03:58:16 ~]#awk -v FS=',' -v OFS="===" -v RS=";" '{print $3,$3}' f1.txt c===c 3===3 C aa===C aa ORS:输出记录分隔符,输出时用指定符号代替换行符 awk -v RS=' ' -v ORS='###'‘{print }’ /etc/passwd 例:[root@centos7 03:53:52 ~]#cat f1.txt a,d,c;1,2,3,4;A,B,C aa,bb,dd [root@centos7 04:02:23 ~]#awk -v FS=',' -v OFS="===" -v RS=";" -v ORS="----" '{print $3,$3}' f1.txt c===c----3===3----C aa===C aa---- NF:字段数量 awk -F: ‘{print NF}’ /etc/fstab,引用内置变量不用$ awk -F: '{print $(NF-1)}' /etc/passwd 例:[root@centos7 04:07:51 ~]#df |awk -F " " '{print $(NF-1)}' Mounted 8% 0% 0% 2% 0% 1% 17% NR:记录号 awk '{print NR}' /etc/fstab ; awk END'{print NR}' /etc/fstab 例:[root@centos7 04:11:04 ~]#df |awk -F " " '{print NR,$5}' 1 Use% 2 8% 3 0% 4 0% 5 2% 6 0% 7 1% 8 17% FNR:各文件分别计数,记录号 awk '{print FNR}' /etc/fstab /etc/inittab 例:[root@centos7 04:14:11 ~]#awk -F " " '{print FNR,$1}' f1.txt /etc/passwd 1 a,d,c;1,2,3,4;A,B,C 2 aa,bb,dd 1 root:x:0:0:root:/root:/bin/bash 2 bin:x:1:1:bin:/bin:/sbin/nologin 3 daemon:x:2:2:daemon:/sbin:/sbin/nologin 4 adm:x:3:4:adm:/var/adm:/sbin/nologin FILENAME:当前文件名 awk '{print FILENAME}’ /etc/fstab ARGC:命令行参数的个数 awk '{print ARGC}’ /etc/fstab /etc/inittab awk ‘BEGIN {print ARGC}’ /etc/fstab /etc/inittab ARGV:数组,保存的是命令行所给定的各参数 awk ‘BEGIN {print ARGV[0]}’ /etc/fstab /etc/inittab awk ‘BEGIN {print ARGV[1]}’ /etc/fstab /etc/inittab
AWK变量数组
自定义变量(区分字符大小写) (1) -v var=value (2) 在program中直接定义 示例: awk -v test='hello gawk' '{print test}' /etc/fstab awk -v test='hello gawk' 'BEGIN{print test}' awk 'BEGIN{test="hello,gawk";print test}' awk –F:‘{sex=“male”;print $1,sex,age;age=18}’ /etc/passwd cat awkscript {print script,$1,$2} 例:[root@centos7 04:23:27 ~]#awk -F: -v USER="username" -v UID="userid" -v ORS="\n------------\n" '{print USER":"$1"\n"UID":"$3 }' /etc/passwd username:root userid:0 ------------ username:colord userid:996 ------------ username:gluster userid:995 ------------ username:saslauth userid:994 ------------ username:abrt userid:173 ------------ username:setroubleshoot userid:993 ------------ username:rtkit userid:172 awk -F: -f awkscript script=“awk” /etc/passwd 例:[root@centos7 04:36:38 ~]#cat awk.txt {print USER":"$1"\n"UID":"$3;USER="username";UID="userid"} [root@centos7 04:36:51 ~]#awk -F: -f awk.txt /etc/passwd :root :0 username:bin userid:1 username:daemon userid:2 username:adm userid:3 username:lp userid:4 username:sync userid:5
printf命令bash
格式化输出:printf “FORMAT”, item1, item2, ... (1) 必须指定FORMAT (2) 不会自动换行,须要显式给出换行控制符,\n (3) FORMAT中须要分别为后面每一个item指定格式符 格式符:与item一一对应 %c: 显示字符的ASCII码 %d, %i: 显示十进制整数 %e, %E:显示科学计数法数值 %f:显示为浮点数 %g, %G:以科学计数法或浮点形式显示数值 %s:显示字符串 %u:无符号整数 %%: 显示%自身 修饰符: #[.#]:第一个数字控制显示的宽度;第二个#表示小数点后精度,%3.1f -: 左对齐(默认右对齐) %-15s +:显示数值的正负符号 %+d 例:[root@centos7 04:54:42 ~]#awk -F: '{printf "%-30s|%10d\n", $1,$3}' /etc/passwd root | 0 bin | 1 daemon | 2 adm | 3 lp | 4 sync | 5 shutdown | 6 halt | 7 mail | 8 operator | 11 games | 12 ftp | 14 nobody | 99 systemd-network | 192 例:[root@centos7 05:13:12 ~]#echo "1.23 23.45"|awk '{printf "%3.1f %4.2f",$1,$2}' 1.2 23.45[root@centos7 05:echo "10.23 23.45"|awk '{printf "%3.1f %4.2f",$1,$2}'' 10.2 23.45[root@centos7 05:13:32 ~]#echo "100.23 23.45"|awk '{printf "%3.1f %4.2f",$1,$2}' 100.2 23.45[root@centos7 05:13:40 ~]#echo "100.23 23.45"|awk '{printf "%3.1f %3.2f",$1,$2}' 100.2 23.45[root@centos7 05:13:54 ~]#echo "100.23 23.45"|awk '{printf "%3.1f %3.1f",$1,$2}' 100.2 23.4[root@centos7 05:15:08 ~]# 例:[root@centos7 05:21:56 ~]#echo "a:d c:d;1:2 3" 【支持正则表达式 例:[ :]能够以多个字符为分割符】 a:d c:d;1:2 3 [root@centos7 05:22:29 ~]#echo "a:d c:d;1:2 3" |awk -v RS=";" -F "[: ]" '{print $1,$2}' a d 1 2 [root@centos7 05:23:12 ~]#echo "a:d c:d;1:2 3" |awk -v RS=";" -F "[: ]" '{print $1,$3}' a c 1 3
操做符tcp
算术操做符: x+y, x-y, x*y, x/y, x^y, x%y -x: 转换为负数 +x: 转换为数值 字符串操做符:没有符号的操做符,字符串链接 赋值操做符: =, +=, -=, *=, /=, %=, ^= ++, -- 下面两语句有何不一样 • awk ‘BEGIN{i=0;print ++i,i}’ • awk ‘BEGIN{i=0;print i++,i}’ BECIN【在文件处理以前先执行一遍这样的操做】 操做符 比较操做符: ==, !=, >, >=, <, <= 模式匹配符: ~:左边是否和右边匹配包含 !~:是否不匹配 示例: awk –F: '$0 ~ /root/{print $1}‘ /etc/passwd awk '$0~“^root"' /etc/passwd awk '$0 !~ /root/‘ /etc/passwd awk –F: ‘$3==0’ /etc/passwd 逻辑操做符:与&&,或||,非! 示例: • awk –F: '$3>=0 && $3<=1000 {print $1}' /etc/passwd • awk -F: '$3==0 || $3>=1000 {print $1}' /etc/passwd • awk -F: ‘!($3==0) {print $1}' /etc/passwd • awk -F: ‘!($3>=500) {print $3}’ /etc/passwd 函数调用: function_name(argu1, argu2, ...) 条件表达式(三目表达式): selector?if-true-expression:if-false-expression • 示例: awk -F: '{$3>=1000?usertype="Common User":usertype="Sysadmin or SysUser";printf "%15s:%-s\n",$1,usertype}' /etc/passwd
awk PATTERNide
PATTERN:根据pattern条件,过滤匹配的行,再作处理 (1)若是未指定:空模式,匹配每一行 (2) /regular expression/:仅处理可以模式匹配到的行,须要用/ /括起来 awk '/^UUID/{print $1}' /etc/fstab awk '!/^UUID/{print $1}' /etc/fstab (3) relational expression: 关系表达式,结果为“真”才会被处理 真:结果为非0值,非空字符串 假:结果为空字符串或0值 示例: awk -F: 'i=1;j=1{print i,j}' /etc/passwd awk ‘!0’ /etc/passwd ; awk ‘!1’ /etc/passwd Awk -F: '$3>=1000{print $1,$3}' /etc/passwd awk -F: '$3<1000{print $1,$3}' /etc/passwd awk -F: '$NF=="/bin/bash"{print $1,$NF}' /etc/passwd awk -F: '$NF ~ /bash$/{print $1,$NF}' /etc/passwd 4) line ranges:行范围 startline,endline:/pat1/,/pat2/ 不支持直接给出数字格式 awk -F: ‘/^root\>/,/^nobody\>/{print $1}' /etc/passwd awk -F: ‘(NR>=10&&NR<=20){print NR,$1}' /etc/passwd 例:[root@centos7 17:49:46 ~]#awk 'NR>=1 && NR<=3 {print $0}' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin [root@centos7 17:50:24 ~]#sed -n '1,3p' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin [root@centos7 17:55:59 ~]#awk '/^r/,/^d/' /etc/passwd [root@centos7 17:56:02 ~]#sed -n '/^r/,/^d/p' /etc/passwd (5) BEGIN/END模式 BEGIN{}: 仅在开始处理文件中的文本以前执行一次 END{}:仅在文本处理完成以后执行一次 示例 awk -F : 'BEGIN {print "USER USERID"} {print $1":"$3} END{print "end file"}' /etc/passwd awk -F : '{print "USER USERID“;print $1":"$3} END{print "end file"}' /etc/passwd awk -F: 'BEGIN{print " USER UID \n--------------- "}{print $1,$3}' /etc/passwd awk -F: 'BEGIN{print " USER UID \n--------------- "}{print $1,$3}'END{print "=============="} /etc/passwd seq 10 |awk ‘i=0’ seq 10 |awk ‘i=1’ seq 10 | awk 'i=!i‘ seq 10 | awk '{i=!i;print i}‘ seq 10 | awk ‘!(i=!i)’ seq 10 |awk -v i=1 'i=!i' 例:[root@centos7 17:14:48 ~]#df |awk -F "[ %]+" '/\/dev\/sda/{print $1,$5}' /dev/sda2 8 /dev/sda5 1 /dev/sda1 17 例:[root@centos7 17:45:09 ~]#awk -F: 'i=0{print $0}' /etc/passwd [root@centos7 17:45:22 ~]#awk -F: '!(i=0){print $0}' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
awk 控制语句函数
{ statements;… } 组合语句 if(condition) {statements;…} if(condition) {statements;…} else {statements;…} while(conditon) {statments;…} do {statements;…} while(condition) for(expr1;expr2;expr3) {statements;…} break continue delete array[index] delete array exit
awk控制语句 if-else
语法:if(condition){statement;…}[else statement] if(condition1){statement1}else if(condition2){statement2}else{statement3} 使用场景:对awk取得的整行或某个字段作条件判断 示例: awk -F: '{if($3>=1000)print $1,$3}' /etc/passwd awk -F: '{if($NF=="/bin/bash") print $1}' /etc/passwd awk '{if(NF>5) print $0}' /etc/fstab awk -F: '{if($3>=1000) {printf "Common user: %s\n",$1} else {printf "root or Sysuser: %s\n",$1}}' /etc/passwd awk -F: '{if($3>=1000) printf "Common user: %s\n",$1; else printf "root or Sysuser: %s\n",$1}' /etc/passwd df -h|awk -F% '/^\/dev/{print $1}'|awk '$NF>=80{print $1,$5}‘ awk ‘BEGIN{ test=100;if(test>90){print “very good“} else if(test>60){ print ”good”}else{print “no pass”}} 例:[root@centos7 18:33:05 ~]#df |awk -F"[ %]+" '/^\/dev\/sda/{if($5>5) print $1,$5}' /dev/sda2 8 /dev/sda1 17 例:[root@centos7 18:42:52 ~]#cat access_log |awk '{print $1}' |sort |uniq -c |sort -nr|awk '{if ($1>80)print $0}' 44487 172.20.7.53 3000 172.20.112.38 2255 172.20.128.22 1206 172.20.130.5 407 172.20.129.234 220 172.20.129.246 210 192.168.32.7 195 172.20.120.185 100 172.20.32.7 例:[root@centos7 18:59:20 ~]#awk 'BEGIN{sum=0;i=1;while(i<=100){sum+=i;i++};print sum}' 5050
awk控制语句
while循环 语法:while(condition){statement;…} 条件“真”,进入循环;条件“假”,退出循环 使用场景: 对一行内的多个字段逐一相似处理时使用 对数组中的各元素逐一处理时使用 示例: awk '/^[[:space:]]*linux16/{i=1;while(i<=NF){print $i,length($i); i++}}' /etc/grub2.cfg awk ‘/^[[:space:]]*linux16/{i=1;while(i<=NF) {if(length($i)>=10) {print $i,length($i)}; i++}}’ /etc/grub2.cfg do-while循环 语法:do {statement;…}while(condition) 意义:不管真假,至少执行一次循环体 示例: awk 'BEGIN{ total=0;i=0;do{ total+=i;i++;}while(i<=100);print total}’ for循环 语法:for(expr1;expr2;expr3) {statement;…} 常见用法: for(variable assignment;condition;iteration process) {for-body} 特殊用法:可以遍历数组中的元素 语法:for(var in array) {for-body} 示例: awk '/^[[:space:]]*linux16/{for(i=1;i<=NF;i++) {print $i,length($i)}}' /etc/grub2.cfg
awk控制语句
switch语句 语法:switch(expression) {case VALUE1 or /REGEXP/: statement1; case VALUE2 or /REGEXP2/: statement2; ...; default: statementn} break和continue awk ‘BEGIN{sum=0;for(i=1;i<=100;i++) {if(i%2==0)continue;sum+=i}print sum}‘ awk ‘BEGIN{sum=0;for(i=1;i<=100;i++) {if(i==66)break;sum+=i}print sum}‘
awk数组
关联数组:array[index-expression] index-expression: • (1) 可以使用任意字符串;字符串要使用双引号括起来 • (2) 若是某数组元素事先不存在,在引用时,awk会自动建立此元素,并将其值 初始化为“空串” • (3) 若要判断数组中是否存在某元素,要使用“index in array”格式进行遍历 示例: weekdays[“mon”]="Monday“ awk 'BEGIN{weekdays["mon"]="Monday"; weekdays["tue"]="Tuesday";print weekdays["mon"]}‘ awk ‘!arr[$0]++’ dupfile awk '{!arr[$0]++;print $0, arr[$0]}' dupfile awk数组 若要遍历数组中的每一个元素,要使用for循环 for(var in array) {for-body} 注意:var会遍历array的每一个索引 示例: awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"] ="Tuesday";for(i in weekdays) {print weekdays[i]}}‘ netstat -tan | awk '/^tcp/{state[$NF]++}END {for(i in state) { print i,state[i]}}' awk '{ip[$1]++}END{for(i in ip) {print i,ip[i]}}' /var/log/httpd/access_log
awk函数
数值处理: rand():返回0和1之间一个随机数 awk 'BEGIN{srand(); for (i=1;i<=10;i++)print int(rand()*100) }' 字符串处理: • length([s]):返回指定字符串的长度 • sub(r,s,[t]):对t字符串搜索r表示模式匹配的内容,并将第一个匹配内容替换为s echo "2008:08:08 08:08:08" | awk 'sub(/:/,“-",$1)' • gsub(r,s,[t]):对t字符串进行搜索r表示的模式匹配的内容,并所有替换为s所表 示的内容 echo "2008:08:08 08:08:08" | awk ‘gsub(/:/,“-",$0)' • split(s,array,[r]):以r为分隔符,切割字符串s,并将切割后的结果保存至array所 表示的数组中,第一个索引值为1,第二个索引值为2,… netstat -tn | awk '/^tcp\>/{split($5,ip,":");count[ip[1]]++} END{for (i in count) {print i,count[i]}}’ awk函数 自定义函数格式: function name ( parameter, parameter, ... ) { statements return expression } 示例: cat fun.awk function max(x,y) { x>y?var=x:var=y return var } BEGIN{a=3;b=2;print max(a,b)} awk –f fun.awk