1、名词简介linux
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来,最经常使用。git
egrep (extended grep) egrep是grep的扩展,支持更多的re正则表达式元字符,等同于grep -E。正则表达式
fgrep (fixed grep) 就是fixed grep或fast grep,它们把全部的字母都看做单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,再也不特殊,等同于grep -F,相对于grep和egrep的执行速度最快。shell
正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在不少文本编辑器里,正则表达式一般被用来检索、替换那些符合某个模式的文本。express
所谓元字符就是指那些在正则表达式中具备特殊意义的专用字符,能够用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。bash
转义字符是这样一个字符,标志着在一个字符序列中出如今它以后的后续几个字符采起一种替代解释。转义字符是元字符(en:metacharacter)的一种特殊状况。一般,断定某字符是否为转义字符由上下文肯定。转义字符即标志着转义序列开始的那个字符。编辑器
转义字符的英文为Escape character。本来是指ASCII中的十进制27,十六进制1D,八进制033所定义的那个字符。对应于标准键盘左上角的ESC键。老式键盘若是没有ESC键,替代输入是“Ctrl+[”。在老式的计算机外设控制协议,ASCII码的十进制27这个字符开始的一个字符序列,是外设的控制序列,不能按照这些字符的字面意义解释。后来,就把最初的狭义的Escape character的含义引伸开来,在各类计算机语言与协议中,标志着一个转义序列开始的那个字符,都叫作Escape character。最多见的一个例子是C程序设计语言中,用反斜线字符“\”做为转义字符,来表示那些不可打印的ASCII控制符。在URI协议中,转义字符是百分号“%”。ide
2、 表达符集工具
基本元字符编码
grep,egrep 均可用,部分基本元字符 egrep或grep -E 使用时不加“\”,详见扩展元字符。
分组标记匹配字符,如'\(love\)',love被标记为1。
锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行。
\?
匹配零个或一个先前的字符。如:'gre\?p'匹配gr后跟一个或零个e字符,而后是p的行。
扩展元字符
POSIX字符类
3、语法
grep [options] "pattern" FILE
4、经常使用选项(如没有特殊标识则grep、egrep、fgrep通用)
--color=aoto
匹配的内容高亮显示。
-?
-A #
显示匹配到的行时,顺带显示其后面的#个行;
-B #
显示匹配到的行时,顺带显示前面的#行;
-C #
显示匹配到的行时,顺带显示后面的#行;
递归的读取目录下的全部文件,包括子目录。 好比grep -R 'pattern' test会在 test 及其子目录下的全部文件中,匹配 pattern。
-E
使用扩展的正则表达式,只有grep有此选项,使用后同egrep。
-F
只有grep有此选项,使用后同fgrep。
5、示例
一、显示/proc/meminfo文件中以不区分大小写的s开头的行;
# grep -i "^s" /proc/meminfo
# grep "^[Ss]" /proc/meminfo
二、显示/etc/passwd中以nologin结尾的行
# grep "nologin$" /etc/passwd
取出默认shell 为/sbin/nologin的用户列表
# grep nologin$" /etc/passwd|cut -d: f1
取出默认shell为bash,且其用户ID号最小 的用户的用户名
# grep "/bin/bash$" /etc/passwd | sort -t: -k3 -n |head -1|cut -d: -f1
三、显示/etc/iniitab中以#开头,且后面跟一个或多个空白字符,然后又跟了任意非空白字符的行;
# grep "^#[[:space:]]\{1,\}[^[:space:]]" /etc/inittab
# grep "^[[:space:]]*#[[:space:]]\{1,\}[^[:space:]]" /etc/inittab
# egrep "^[[:space:]]*#[[:space:]]{1,}[^[:space:]]" /etc/inittab
# grep -E "^[[:space:]]*#[[:space:]]+[^[:space:]]" /etc/inittab
四、显示/etc/rc.d/rc.sysinit中符合形为“任意单个字符n任意字符任意单个字符n”模式的行,即任意单个字符后面跟了个n,n后面有任意长度的字符,然后是任意单个字符后面跟了个n;
# grep ".n.*.n" /etc/rc.d/rc.sysinit
要求前n和后n一至:
# grep "\(.n\).*\1" /etc/rc.d/rc.sysinit
# grep -E "(.n).*\1" /etc/rc.d/rc.sysinit
若是.n被匹配到,则.n对应的内容就被存储到内存中,并标记为1,而后搜索任意个字符.*,这些字符后面跟着另一个.n(\1),找到就显示该行。grep -E 或egrep 使用() 不用加 "\"转义。
五、显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行
grep "^[[:space:]]\{1,\}" /boot/grub/grub.conf
六、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;
grep "^\([0-9]\).*\1$" /etc/inittab
找出某文件中的,1位数,或2位数;
grep "\<[0-9]\{1,2\}\>"
grep -w "[0-9]\{1,2\}"
七、找出ifconfig命令结果 中的的1-255之间的整数;
/sbin/ifconfig|grep --color=auto -w -E "[1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]"
/sbin/ifconfig|grep --color=auto -E "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>
八、显示/etc/inittab中包含 halt 或 Single的行
grep -E "(halt|Single)" /etc/inittab
egrep "(halt|Single)" /etc/inittab