python正则表达式(6)--split、sub、escape方法

时间 2019-11-11

标签 python 正则表达式 split sub escape 方法栏目 Python 繁體版

原文原文链接

1.re.split

语法：python

　　re.split(pattern, string[, maxsplit=0, flags=0])正则表达式

参数：函数

　　pattern 匹配的正则表达式spa

　　string 要匹配的字符串。对象

maxsplit 分隔次数，maxsplit=1 分隔一次，默认为 0，不限制次数。字符串

>>>import restring

>>> re.split('\W+', 'runoob, runoob, runoob.')it

['runoob', 'runoob', 'runoob', '']class

>>> re.split('(\W+)', ' runoob, runoob, runoob.')import

['', ' ', 'runoob', ', ', 'runoob', ', ', 'runoob', '.', '']

>>> re.split('\W+', ' runoob, runoob, runoob.', 1)

['', 'runoob, runoob, runoob.']

>>> re.split('[,\.]',r'hello,Tom.how are you')

['hello', 'Tom', 'how are you']

>>> re.split('a*', 'hello world')

['hello world']

语法：

　　re.sub(pattern, repl, string, count=0, flags=0)

　　pattern.sub(repl, string[, count = 0])

参数：

能够使用\id或\g<id>、\g<name>引用分组，但不能使用编号0。

它必须传一个Match对象，并必须返回一个字符串用于替换（返回的字符串中不能再引用分组）。

这个函数跟sub函数用法差很少，只是它有一个额外的特征，结果是返回一个tuple，tuple第一个元素是替换后的新字符串，第二个元素是替换的次数。

import re

def add(m):

v = int(m.group(0))

return str(v + 1)

p = re.compile("(\d+)")

result = p.subn(add, "1 2 3 4 5")

print result

>>>('2 3 4 5 6', 5)

能够将字符串中全部可能被解释为正则运算符的字符进行转译。

>>> re.escape('www.python.org')

'www\\.python\\.org'