使用awk取某一行数据中的倒数第N列:$(NF-(n-1))
好比取/etc/passwd文件中的第2列、倒数第一、倒数第二、倒数第4列(以冒号为分隔符)。($NF表示倒数第一列,$(NF-1)表示倒数第二列)node
[root@ipsan-node06 ~]# cat /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin sync:x:5:0:sync:/sbin:/bin/sync shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown halt:x:7:0:halt:/sbin:/sbin/halt mail:x:8:12:mail:/var/spool/mail:/sbin/nologin operator:x:11:0:operator:/root:/sbin/nologin [root@ipsan-node06 ~]# awk -F":" '{print $2,$(NF),$(NF-1),$(NF-3)}' /etc/passwd x /bin/bash /root 0 x /sbin/nologin /bin 1 x /sbin/nologin /sbin 2 x /sbin/nologin /var/adm 4 x /sbin/nologin /var/spool/lpd 7 x /bin/sync /sbin 0 x /sbin/shutdown /sbin 0 x /sbin/halt /sbin 0 x /sbin/nologin /var/spool/mail 12 x /sbin/nologin /root 0
linux实现将文本文件每一行中相同第一列对应的其余列进行拼接linux
[root@jump-v4 ~]# sort b.txt|uniq 1 34 1 49 2 45 2 48 3 54 3 57 3 89 [root@jump-v4 ~]# sort b.txt|uniq|awk '{a[$1]=(a[$1]" "$2);} END{for(i in a) print i ":"a[i]}' 1: 34 49 2: 45 48 3: 54 57 89 命令解析: 1)首先sort test|uniq实现对test文件的去重,去掉了重复的 1 49,保留不一样的行; 2)awk '{a[$1]=(a[$1]" "$2);} END{for(i in a) print i ":"a[i]}' 表示的含义是: 将每一行的第一列最为数组a的key, 第二列做为a的value,同时碰到相同的key,就把其值进行拼接,linux的shell的字符串拼接形式为str = (str “ ” $var), 最后遍历数组a,其中i为数组a的每个key,a[i]为key对应的值;
使用awk命令获取文本的某一行,某一列的技巧:shell
1)打印文件的第一列(域) : awk '{print $1}' filename 2)打印文件的前两列(域) : awk '{print $1,$2}' filename 3)打印完第一列,而后打印第二列 : awk '{print $1 $2}' filename 4)打印文本文件的总行数 : awk 'END{print NR}' filename 5)打印文本第一行 :awk 'NR==1{print}' filename 6)打印文本第二行第一列 :sed -n "2, 1p" filename | awk 'print $1'
Awk取文件中的指定数据数组
[root@jump-v4 ~]# cat a.txt 123.122.123.12 12121212 121.2332.121.11 232323 255.255.255.255 21321 123.122.123.12 12121212 123.122.123.12 1212121er2 123.122.123.12 12121212eer 123.122.123.12 12121212ere 255.255.255.255 21321 121.2332.121.11 232323 255.255.255.255 21321 [root@jump-v4 ~]# cat a.txt|awk '{print $1}' 123.122.123.12 121.2332.121.11 255.255.255.255 123.122.123.12 123.122.123.12 123.122.123.12 123.122.123.12 255.255.255.255 121.2332.121.11 255.255.255.255 [root@jump-v4 ~]# cat a.txt|awk '{print $1}'|sort|uniq -c 2 121.2332.121.11 5 123.122.123.12 3 255.255.255.255 [root@jump-v4 ~]# cat a.txt|awk '{print $1}'|sort|uniq -c|awk '{print $2,$1}' 121.2332.121.11 2 123.122.123.12 5 255.255.255.255 3 [root@jump-v4 ~]# cat a.txt|awk '{print $1}'|sort|uniq -c|awk '{print $2,$1}'|sort -k2 -rn 123.122.123.12 5 255.255.255.255 3 121.2332.121.11 2
linux文件按大小来排序bash
[root@cdn ~]# ls -s | sort -k 1 -n 表示对第一个字段(即文件大小)按数值大小进行排序; 若是想倒序,能够增长-r参数; sort命令可进行排序; -k参数表示对第几个字段进行排序; ls -s:第一列显示的是文件大小
定时删除resin日志的脚本,每小时删除一次app
[root@cdn ~]# cat resin-log.sh #!/bin/bash cd /data/log/resin && find /data/log/resin \( -name "*jvm-app-0.log.*" -a ! -name "*.gz" \) -a -mmin +30 -exec gzip {} \; [root@cdn ~]# crontab -l 0 * * * * /bin/bash -x /root/resin-log.sh >/dev/null 2>&1
awk 获取某些列的某些行(打印或不打印第几行)jvm
NR==n 表示打印第n行 NR!=n 表示不打印第n行 1)取test.txt文件中的第1,2列,不打印第一行 [root@bz4citestap1014 app_zhibiao.sh]# cat test.txt wang 11 aa shi 22 bb kevin 33 cc grace 44 dd hui 55 ee [root@bz4citestap1014 app_zhibiao.sh]# awk 'NR!=1 {print $1,$2}' test.txt shi 22 kevin 33 grace 44 hui 55 2)取test.txt文件中的第3列的第2行 [root@bz4citestap1014 app_zhibiao.sh]# awk 'NR==2 {print $3}' test.txt bb
awk中的"匹配"与"不匹配"ui
~ 匹配正则 !~ 不匹配正则 == 等于 != 不等于 [root@kevin~]# cat test.txt afjdkj 80 lkdjfkja 8080 dfjj 80 jdsalfj 808080 jasj 80 jg 80 linuxidc 80 80 ajfkj asf 80 80 linuxidc wang bo kevin grace ha 80880 1) 打印上面test文件中第二列匹配80开头并以80结束的行 [root@kevin~]# awk '{if($2~/^80$/)print}' test.txt afjdkj 80 dfjj 80 jasj 80 jg 80 linuxidc 80 asf 80 2)打印上面test文件中第二列中不匹配80开头并以80结束的行 [root@kevin~]# awk '{if($2!~/^80$/)print}' test.txt lkdjfkja 8080 jdsalfj 808080 80 ajfkj 80 linuxidc wang bo kevin grace ha 80880 3)打印上面test文件中第二列是"bo"的行 [root@kevin~]# cat test.txt |awk '{if($2=="bo")print}' wang bo
AWK的内置变量(NF、NR、FNR、FS、OFS、RS、ORS)spa
NF 字段个数,(读取的列数) NR 记录数(行号),从1开始,新的文件延续上面的计数,新文件不从1开始 FNR 读取文件的记录数(行号),从1开始,新的文件从新从1开始计数 FS 输入字段分隔符,默认是空格 OFS 输出字段分隔符 默认也是空格 RS 输入行分隔符,默认为换行符 ORS 输出行分隔符,默认为换行符 示例文件test: [rootkevin ~]# cat test zhong guo ren is noce! beijing is a good city。 sheg as juf 88u kk halt:x:7:0:halt /sbin:/sbin/halt operator x 0:operator /root:/sbin/nologin 1)NF:读取记录的字段数(列数) [rootkevin ~]# awk -F" " '{print "字段数: " NF}' test 字段数: 5 字段数: 5 字段数: 5 字段数: 2 字段数: 4 如上,awk在读取文件时,按行读取,每一行的字段数(列数),赋值给内置变量NF,打印出来的就是每行的字段总数。 [rootkevin ~]# awk '{print $NF}' test noce! city。 kk /sbin:/sbin/halt /root:/sbin/nologin 若是有需求,只须要最后一列的数据,因为每一行的列数不一,最后一列没法指定固定的列数,可使用NF来表示列数$NF表示打印出等于总列数的那一列的数据, 显而易见就是打印最后一列的数据。 2)NR:读取文件的行数(在某些应用场景中能够看成行号来使用) [rootkevin ~]# awk '{print "行号为:" NR}' test 行号为:1 行号为:2 行号为:3 行号为:4 行号为:5 如上,打印出读取文件的行数,由于是按行读取,在应用场景中,行数能够等同于行号,用来输出对应行的行号,NR 还能够用做判断输出,以下简单例子: [rootkevin ~]# awk '{if(NR>2)print "行号为:" NR }' test 行号为:3 行号为:4 行号为:5 3)FNR:读取文件的行数,可是和"NR"不一样的是当读取的文件有两个或两个以上时,NR读取完一个文件,行数继续增长 而FNR从新从1开始记录 [rootkevin ~]# cp test test1 [rootkevin ~]# awk '{print "NR:"NR "FNR:"FNR}' test test1 NR:1FNR:1 NR:2FNR:2 NR:3FNR:3 NR:4FNR:4 NR:5FNR:5 NR:6FNR:1 NR:7FNR:2 NR:8FNR:3 NR:9FNR:4 NR:10FNR:5 打印的两列之间加上空格 [rootkevin ~]# awk '{print "NR:"NR " " "FNR:"FNR}' test test1 NR:1 FNR:1 NR:2 FNR:2 NR:3 FNR:3 NR:4 FNR:4 NR:5 FNR:5 NR:6 FNR:1 NR:7 FNR:2 NR:8 FNR:3 NR:9 FNR:4 NR:10 FNR:5 由上可知,NR从一开始一直增长,FNR每读取到一个新的文件,行数从新从一开始增长。 有一个有趣的应用,比较两个文件A,B是否一致,以A做为参考,不一致的输出行号 [rootkevin ~]# cat A a aa aaa 1 b bb bbb 2 c cc ccc d dd ddd 4 e ee eee 5 [rootkevin ~]# cat B a aa aaa 1 b bb bbb 2 c cc ccc 3 d dd ddd 4 e ee eee 5 [rootkevin ~]# awk '{if(NR==FNR){arry[NR]=$0}else{if(arry[FNR]!=$0){print FNR}}}' A B 3 4)FS:输入字段分割符,默认是以空格为分隔符,在平常中经常文本里面不都以空格分隔,此时就要指定分割符来格式化输入。 [rootkevin ~]# cat test2 a,b,c 1,2,3 aa,dd,ee [rootkevin ~]# awk '{print $1}' test2 a,b,c 1,2,3 aa,dd,ee [rootkevin ~]# awk 'BEGIN{FS=","}{print $1}' test2 a 1 aa 使用-F参数也能够 [rootkevin ~]# awk -F"," '{print $1}' test2 a 1 aa 5)OFS:输出字段分割符,默认为空格,若是读进来的数据是以空格分割,为了需求可能要求输出是以"-"分割,可使用OFS进行格式化输出。 [rootkevin ~]# cat test3 a aa aaa 1 b bb bbb 2 c cc ccc d dd ddd 4 e ee eee 5 [rootkevin ~]# awk 'BEGIN{FS=" ";OFS="--"}{print $1,$2,$3}' test3 a--aa--aaa b--bb--bbb c--cc--ccc d--dd--ddd e--ee--eee [rootkevin ~]# awk -vOFS="|" 'NF+=0' test3 a|aa|aaa|1 b|bb|bbb|2 c|cc|ccc d|dd|ddd|4 e|ee|eee|5 [rootkevin ~]# cat test6 172.10.10.10 172.10.10.11 172.10.10.12 172.10.10.13 172.10.10.14 [rootkevin ~]# awk 'BEGIN{FS=".";OFS="--"}{print $1,$2,$3}' test6 172--10--10 172--10--10 172--10--10 172--10--10 172--10--10 6)RS:输入行分隔符,判断输入部分的行的起始位置,默认是换行符 [rootkevin ~]# cat test4 a,b,c d,e,f g,h,i j,k,l [rootkevin ~]# awk 'BEGIN{RS=","}{print}' test4 a b c d e f g h i j k l [rootkevin ~]# 这里说明一下,RS=","将以,为分割看成一行,即a被看成一行,b也被看成一行,可是细心的会发现和d之间是没有","的为何也看成一行了呢, 是由于输入中c后面还有一个换行符\n 即,输入应该是a,b,c\n只不过\n咱们看不到,输入中,a一行,b一行,c\nd一行可是输出的时候系统会将\n视为换行符, 因此看上去c和d是两行,其实是一行。 7)ORS:输出行分割符,默认的是换行符,它的机制和OFS机制同样,对输出格式有要求时,能够进行格式化输出 [rootkevin ~]# cat test5 1 22,aa:bb haha,hehe aa bb cc [rootkevin ~]# awk 'BEGIN{ORS=" "}{print}' test5 1 22,aa:bb haha,hehe aa bb cc [rootkevin ~]# cat test6 172.10.10.10 172.10.10.11 172.10.10.12 172.10.10.13 172.10.10.14 [rootkevin ~]# awk 'BEGIN{ORS=","}{print}' test6 172.10.10.10,172.10.10.11,172.10.10.12,172.10.10.13,172.10.10.14, 也能够以下实现以","隔开放在一行 [rootkevin ~]# cat test6|xargs 172.10.10.10 172.10.10.11 172.10.10.12 172.10.10.13 172.10.10.14 [rootkevin ~]# cat test6|xargs|sed 's/ /,/g' 172.10.10.10,172.10.10.11,172.10.10.12,172.10.10.13,172.10.10.14