grep、egrep及相应的正则表达式和用法

时间 2020-10-06

标签 git 正则表达式 ide spa regexp blog 图片字符串 get 栏目正则表达式繁體版

原文原文链接

grep与egrep都是基于“PATTERN”对指定的文本进行搜索（文本处理三剑客之一）git

grep与egrep的区别在于grep默认支持的是基本正则表达式egrep默认支持扩展的正则表达式正则表达式

先从grep的选项提及ide

使用格式：grep [OPTION]... PATTERN [FILE]...ui

有如下选项：
spa

-i, --ignore-case：忽略文本字符的大小写regexp

-v, --invert-match：反向匹配；最终显示的结果是PATTERN不能成功匹配的行blog

-C NUM, -NUM, --context=NUM：统计匹配PATTERN的全部的行数；图片

-o, --only-matching；关闭贪婪模式，仅显示PATTERN匹配的内容字符串

-q, --quiet, --silent：不输出任何匹配结果get

--color[=WHEN], --colour[=WHEN]：将匹配的PATTERN内容以特殊颜色高亮显示

-E, --extended-regexp：扩展的正则表达式，grep -E至关于egrep

-F, --fixed-strings, --fixed-regexp：至关于fgrep

-G, --basic-regexp：基本的正则表达式，即egrep -G至关于grep

-p，--perl-regexp：使用PCRE（perl Common Regular Expression）引擎；

-A NUM, --after-context=NUM：在显示匹配PATTERN行的同时显示其后面的NUM行

-B NUM, --before-context=NUM：在显示匹配PATTERN行的同时显示其前面的NUM行

-C NUM, -NUM, --context=NUM：在显示匹配PATTERN行的同时显示其先后的各NUM行

重要的部分就是PATTERN区域，系正则表达式元字符匹配；

字符匹配类：

.:匹配任意单个字符

例子：

[]:匹配范围内的任意单个字符

例子：

[^]:匹配指定范围之外的任意单个字符；

例子：

下列的全部的字符集均可以放置于[]之中用于匹配单个字符；

[:xdigit:]:全部的16进制数字

a-z：全部的小写字母

A-Z: 全部的大写字母

0-9：全部的十进制数字

次数匹配字符：该类字符以前的那个字符能够出现的次数；

*：其前面的字符能够出现人意次（0次，1次或屡次）；

例子：

\?:其前面的字符无关紧要（0次或1次）

例子：

\+:其前面的字符至少出现一次（1次或屡次）

举例：grep 'x*y' /PATH ：匹配含有y字符前面有或没有x字符的行

\{m\}:其前面的字符必须出现m次

例子：

\{m,n\}:其前面的字符至少出现m次，至多出现n次；（m<n）

\{,n\}:其前面的字符只收出现0次，至多出现n次

\{m,\}:其前面的字符至少出现m次，×××；

在正则表达式中，表示任意长度任意字符的方式：.*

位置锚定字符：

行锚定：

行首锚定：^

行尾锚定：$

字锚定：

字首锚定：\<或\b

字尾锚定: \>或\b

\b:旧版本中的锚定方法，建议不使用；

例子：查找显示root用户

对于正则表达式引擎来讲，字是由非特殊字符组成的字符串

分组与引用字符：

$PATTERN$:将PATTERN匹配到字符做为一个总体来处理

例子：grep '$xy$\+' 文件名匹配含有xy的行

在正则表达式引擎之中，有一系列内置变量，这些变量会保存全部分组内的字符信息，用于后向引用；这些变量一次是：\1,\2,\3,...

pattern1$pattern2$pattern3$pattern4\(pattern5$\)

\1:pattern2

\2:pattern4

\3:pattern5

因此\1:第一组小括号中的pattern匹配到的字符；

\2:第二组小括号中的pattern匹配到的字符；

...

例子：找出在/etc/passwd中用户的UID和GID相同的用户帐户：

或：\|

注意:\|将其左右两遍的字符串看成总体对待

例子：找出ifconfig命令的执行结果中数值在100-255之间的整数；

第一位： 1 2

第二位： 0-9 0-4 5

第三位： 0-9 0-9 0-5

那么egrep用法就是相似与grep 只不过egrep是用的扩展的正则表达式就是去掉“\”的元字符

egrep ：

egrep [OPTIONS] PATTERN [FILE...]

扩展的正则表达式元字符：

字符匹配：

[]

[^]

次数匹配：

{m}

{m,n}

{0,n}

位置锚定

\<,\b

\>,\b

分组和引用：

（）

\1,\2,\3,...

或：