一、sed 流编辑器,实现对文字的增删改替换查(过滤、取行),能同时处理多个文件多行的内容,能够不对原文件改动,把整个文件输入到屏幕,能够把只匹配到模式的内容输入到屏幕上。还能够对原文件改动,可是不会再屏幕上返回结果。html
流程:Sed软件从文件或管道中读取一行,处理一行,输出一行;再读取一行,再处理一行,再输出一行……正则表达式
模式空间:sed软件内部的一个临时缓存,用于存放读取到的内容。缓存
二、命令格式:sed [选项] [命令] [输入文件]bash
sed命令的经常使用选项:app
-n :只打印模式匹配的行,通常与 p 一块儿使用。如:sed -n ' 2p ' /data 表示输出/data的第二行,如:sed -n '20,30p' /data/boy显示 /data/boy的20到30行。编辑器
-e :进行多项编辑,即对输入行应用多条sed命令时使用,此为默认选项。如:sed -e '/^#/d' -e '/^$/d' /data/boy表示删除空格的行和#开头的行。ide
-f :将sed的动做写在一个脚本文件内,用–f filename 执行filename内的sed动做。spa
-r :支持扩展表达式code
-i :直接修改文件内容,如:sed -i s#old#new#g orm
经常使用基本命令:
d :delete, 删除匹配到的行;
r /file :read, 将指定文件的内容读取至当前模式空间中被匹配到的行后面,经常使用于实现文件合并;
sed -i '/Ethernet/r myfile' test 匹配Ethernet的行,读进来另外一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后
y:用于(对应)转换字符;
三、sed在文件中查询文本的方式
x/p |
查询第x行 |
sed -n '2p ' /data |
x,y/p | 查询从x到y行 | sed -n '1,3p ' /data |
/pattern/p | 查询包含pattern的行 | sed -n '/pattern/p' /data |
/pattern 1/,/pattern 2/p | 查询包含pattern 1或pattern 2的行 | sed -n '/pn1/,/pn2/p' /data |
/pattern/,xp | 查询从包含pattern的行到x行 |
sed -n '/pn/,5p' /data |
x,/pattern/p | 查询从x到包含pattern的行 | sed -n '5,/pn/p' /data |
x,y!p | 查询不包含指定行号x和y的行 | sed -n '5,8!p' /data |
10{sed-commands} 对第10行操做
10,20{sed-commands} 对10到20行操做,包括第10,20行
10,+20{sed-commands} 对10到30(10+20)行操做,包括第10,30行
1~2{sed-commands} 对1,3,5,7,……行操做
10,${sed-commands} 对10到最后一行($表明最后一行)操做,包括第10行
/oldboy/{sed-commands} 对匹配oldboy的行操做
/oldboy/,/Alex/{sed-commands} 对匹配oldboy的行到匹配Alex的行操做
/oldboy/,${sed-commands} 对匹配oldboy的行到最后一行操做
/oldboy/,10{sed-commands} 对匹配oldboy的行到第10行操做,注意:若是前10行没有匹配到oldboy,sed软件会显示10行之后的匹配oldboy的行,若是有。
1,/Alex/{sed-commands} 对第1行到匹配Alex的行操做
/oldboy/,+2{sed-commands} 对匹配oldboy的行到其后的2行操做
四、案例(sed 后不跟 -i 表示仅对输出改变,对源文件不改变)
单行增长到第2行后: sed '2a 106,dandan,CSO' person.txt
单行增长到第2行前: sed '2i 106,dandan,CSO' person.txt
多行增长到第2行前: sed '2i 106,dandan,CSO\n107,bingbing,CCO' person.txt,每行之间加换行符 \n
删除第二行: sed '2d' person.txt
删除匹配oldboy或者Alex的行 sed '/oldboy/,/Alex/d' person.txt
用新行替代第2行 sed '2c 106,dandan,CSO' person.txt
分组替换\( \)和\1的使用说明
sed软件的\( \)
的功能能够记住正则表达式的一部分,其中,\1
为第一个记住的模式即第一个小括号中的匹配内容,\2
第二记住的模式,即第二个小括号中的匹配内容,sed最多能够记住9个。
例:echo I am oldboy teacher.
若是想保留这一行的单词oldboy,删除剩下的部分,使用圆括号标记想保留的部分。
echo I am oldboy teacher. |sed 's#^.*am \([a-z].*\) tea.*$#\1#g'
思路:用oldboy
字符替换I am oldboy teacher.
下面解释用□
代替空格:
^.*am□
–>这句的意思是以任意字符开头到am□
为止,匹配文件中的I am□
字符串;
\([a-z].*\)□
–>这句的外壳就是括号\(\)
,里面的[a-z]
表示匹配26个字母的任何一个,[a-z].*
合起来就是匹配任意多个字符,本题来讲就是匹配oldboy
字符串,因为oldboy
字符串是须要保留的,所以用括号括起来匹配,后面经过\1
来取oldboy
字符串。
□tea.*$
–>表示以空格tea
起始,任意字符结尾,实际就是匹配oldboy
字符串后,紧接着的字符串□teacher.
;
后面被替换的内容中的\1
就是取前面的括号里的内容了,也就是咱们要的oldboy
字符串。
()
是扩展正则表达式的元字符,sed软件默认识别基本正则表达式,想要使用扩展正则须要使用\
转义,即\(\)
。sed使用-r
选项则能够识别扩展正则表达式,此时使用\(\)
反而会出错。