正则表达式

时间 2019-12-04

标签正则表达式栏目正则表达式繁體版

原文原文链接

一.re模块

python提供re模块，包含全部正则表达式的功能python

使用r前缀,不用考虑转义问题正则表达式

如:
s = r'ABC\-001'对象

判断是否匹配，若是匹配成功，返回一个Match对象，不然返回Noneblog

如:字符串

import re

if re.match(r'\w', 'afefe'):
    print('match')
else:
    print('no')

若是能够切分,返回切分后的列表;若是不能,以列表返回原字符串it

import re

print(re.split(r'\s+', 'a     ,b      d'))

输出:
['a', ',b', 'd']

提取子串,()表示提取的分组编译

import re

r = re.match(r'(\d+)-(\d+)', '010-059')
print(r.groups())
print(r.group(1)) #group(0)表示原字符串,1表示第一个匹配到的

输出:
('010', '059')
010class

正则匹配默认是贪婪匹配，也就是匹配尽量多的字符效率

import re

r = re.match(r'^(\d+)(0*)$', '010000').groups()
print(r)

输出:
('010000', '')import

import re

r = re.match(r'^(\d+?)(0*)$', '010000').groups()
print(r)

输出:
('01', '0000')

当咱们在Python中使用正则表达式时，re模块内部会干两件事情：

若是一个正则表达式要重复使用几千次，出于效率的考虑，咱们能够预编译该正则表达式，接下来重复使用时就不须要编译这个步骤了，直接匹配：

import re

re_num = re.compile(r'^(\d+?)(0*)$')
r = re_num.match('010000').groups()
print(r)