语法:python
re.split(pattern, string[, maxsplit=0, flags=0])正则表达式
参数:函数
pattern 匹配的正则表达式spa
string 要匹配的字符串。对象
maxsplit 分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。字符串
>>>import restring
>>> re.split('\W+', 'runoob, runoob, runoob.')it
['runoob', 'runoob', 'runoob', '']class
>>> re.split('(\W+)', ' runoob, runoob, runoob.')import
['', ' ', 'runoob', ', ', 'runoob', ', ', 'runoob', '.', '']
>>> re.split('\W+', ' runoob, runoob, runoob.', 1)
['', 'runoob, runoob, runoob.']
>>> re.split('[,\.]',r'hello,Tom.how are you')
['hello', 'Tom', 'how are you']
>>> re.split('a*', 'hello world')
['hello world']
语法:
re.sub(pattern, repl, string, count=0, flags=0)
pattern.sub(repl, string[, count = 0])
参数:
能够使用\id或\g<id>、\g<name>引用分组,但不能使用编号0。
它必须传一个Match对象,并必须返回一个字符串用于替换(返回的字符串中不能再引用分组)。
这个函数跟sub函数用法差很少,只是它有一个额外的特征,结果是返回一个tuple,tuple第 一个元素是替换后的新字符串,第二个元素是替换的次数。
import re
def add(m):
v = int(m.group(0))
return str(v + 1)
p = re.compile("(\d+)")
result = p.subn(add, "1 2 3 4 5")
print result
>>>('2 3 4 5 6', 5)
能够将字符串中全部可能被解释为正则运算符的字符进行转译。
>>> re.escape('www.python.org')
'www\\.python\\.org'