python正则表达式(2)--编译正则表达式re.compile

时间 2019-11-11

标签 python 正则表达式编译 re.compile compile 栏目 Python 繁體版

原文原文链接

编译正则表达式-- re.compile

使用re的通常步骤是先将正则表达式的字符串形式编译为pattern实例，而后使用pattern实例处理文本并获取匹配结果（一个Match实例(值为True)），最后使用Match实例获取信息，进行其余的操做。正则表达式

能够把那些常用的正则表达式编译成正则表达式对象，能够提升程序的执行速度。一处编译，多出复用函数

第二个参数flag是匹配模式，取值能够使用按位或运算符“|”表示同时生效，对象

好比re.I | re.M。固然你也可以在regex字符串中指定模式。字符串

如下两种写法等价：编译

re.compile('pattern', re.I | re.M)程序

re.compile('(?im)pattern')方法

Pattern对象是一个编译好的正则表达式，也就是经过re.compile()函数编译后获得结果。im

经过pattern提供的一系列方法能够对文本进行匹配查找co

pattern提供了几个可读属性及方法用于处理正则表达式字典

经过pattern.flags咱们能够查看编译时的选项，该属性表示获取编译时用的匹配模式，以数字形式返回

例：

pattern = re.compile(r'\w+', re.DOTALL)

print pattern.flags

>>>16

经过上面的例子能够看到，flags返回结果既不是re.S也不是re.DOTALL，而是一个数值16。

其实re.S是一个整数，16就是它的值。re.S 、 re.DOTALL 、 16 三者等价，若是是I，则显示数值为2。

编译正则表达式时，也能够使用数字指定匹配模式

例：

re.compile(r'\w+', 16)

该属性表示获取表达式中分组的数量。

例：

pattern = re.compile(r'(\w+)(\d)',re.I)

print pattern.groups

>>>2

以表达式中有别名的组的别名为键、以该组对应的编号为值的字典，没有别名的组不包含在内

p = re.compile(r'(\w+)(?P<sign>.*)', re.DOTALL)

print p.groupindex

>>>{'sign': 2}