一前言
本篇文章带你们快速入门正则表达式的使用,正则表达式的规则不只适用python语言,基本大多数编程语言都适用,在平常使用中极为普遍,读者们有必要学好正则表达式。看完这篇文章,读者们要理解什么是正则表达式,正则表达式的规则,常见的正则表达式示例,如何在python中使用函数进行正则表达式操做;python
二 正则表达式的概念
正则表达式是指在一串字符串中使用特殊的模式匹配得到子串,咱们能够对得到的子串进行提取,替换等操做;正则表达式
举个例子zszxz666 这个字符串,如今知识追寻者想要得到子串zszxz, 则须要通过一个模式匹配后得到子串,在正则表达式中这个模式能够不少种格式,知识追寻者在这边使用最简单的模式 [a-z]*,而后通过python正则表达式匹配函数就能够得到子串zszxz;这种方式比平时的字符串函数操做更加简便,适用范围普遍;
ps:另外不少人在学习Python的过程当中,每每由于没有好的教程或者没人指导从而致使本身容易放弃,为此我建了个Python交流.裙 :一久武其而而流一思(数字的谐音)转换下能够找到了,里面有最新Python教程项目可拿,不懂的问题多跟里面的人交流,都会解决哦!编程
三 经常使用的正则匹配模式
经常使用的正则表达式模式以下,若是对这些模式有疑惑的能够参照 正则表达式手册 ;手册中还有平常使用的正则示例,好比用户名,密码,邮箱,URL 的匹配模式等;网络
模式 含义
^ 匹配字符串的开头
$ 匹配字符串的末尾
. 匹配任意字符,除了换行符
+ 匹配前面的子表达式一次或屡次
? 匹配前面的子表达式零次或一次,或表示一个非贪婪限定符
* 匹配前面的子表达式零次或屡次
\ 转义特殊字符
\d 匹配任意数字,等价于 [0-9]。
\D 匹配任意非数字
\s 匹配任意空白字符(制表,换行,回车,换页,垂直制表),等价于[^\f\n\r\t\v]
\S 匹配任何非空白字符。等价[^\f\n\r\t\v]
\w 匹配数字字母下划线
\W 匹配非数字字母下划线
[…] 用来表示一组字符;[amk] 匹配 ‘a’,‘m’或’k’
[^…] 不匹配在[]中的字符;[^amk]不匹配 ‘a’,‘m’或’k’
{n} 匹配前面的子表达式n 次
{n,} 匹配前面的子表达式至少n 次
{n,m} 匹配前面的子表达式最少匹配 n 次且最多匹配 m 次
| 表示或;a| b,表示匹配a或者b
\b 匹配一个单词边界,即字与空格间的位置
\B 非单词边界匹配
四 python正则经常使用修斯符
re.I 使匹配对大小写不敏感
re.L 作本地化识别(locale-aware)匹配
re.M 多行匹配,影响 ^ 和 $
re.S 使 . 匹配包括换行在内的全部字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X 该标志经过给予你更灵活的格式以便你将正则表达式写得更易于理解
五 python经常使用正则行数说明
pattern 表示正则表达式模式
string 表示传入待匹配字符串
flags 标志位,能够用第四节的修饰符限定
count 表示限定匹配的次数
repl 表示替换的字符串,也可为一个函数
pos 起始位置
endpos 结束位置
maxsplit 最大分割次数
函数名称 函数含义
re.findall(string, pos, endpos) 匹配全部子串,并返回一个列表,未匹配,则返回空列表
re.match(pattern, string, flags=0) 从字符串的起始位置匹配一个模式,若是匹配失败返回None
re.search(pattern, string, flags=0) 扫描整个字符串并返回第一个成功的匹配;匹配失败返回None
re.compile(pattern, flags=0) 编译正则表达式,生成一个正则表达式( Pattern )对象
re.sub(pattern, repl, string, count=0, flags=0) 查找和替换
re.finditer(pattern, string, flags=0) 与findall相似,返回的是迭代器
re.split(pattern, string, maxsplit=0, flags=0]) 将匹配的子串分割后返回列表
六 经常使用函数示例
6.1 match函数
group(num=0) 函数表示提取匹配的表达式,可使用组号提取对应的匹配结果;知识追寻者想要得到字符串中第一个出现的数字串;编程语言
import re
# 指定模式 至少匹配一个数字
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.match("451zszxz666")
# 得到第一个匹配到的值
g = mat.group();
# 451
print(g)
6.2search函数
知识追寻者想要得到指定的字符串,第一个匹配的就好;函数
import re
# 想匹配nhzszxz 或者 nh666 或者 nhnh
pattern = re.compile(r'nh(zszxz|666|nh)')
ser = pattern.search('nhzszxzkkk nh666 llll nhnh')
g_0 = ser.group()
# zszxz
print(g_0)
g_1 = ser.group(1)
# nhzszxz
print(g_1)
6.3 findall函数
知识追寻者想要在字符串中得到全部的数字;工具
import re
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.fidall("451zszxz666")
# ['451', '666']
print(mat)
# 666
print(mat[1])
6.6 sub函数
知识追寻者想要得到全部非数字的子串;学习
import re
str = '8556gfggs5555dfg'
# 替换全部数字
result = re.sub(r'\d', '', str)
# gfggsdfg
print(result)
6.7 split函数
知识追寻者想要得到以,分割的字符串;测试
import re
str = '123,456,zszxz,666'
result = re.split(',',str)
# ['123', '456', 'zszxz', '666']
print(result)
6.8 finditer 函数
知识追寻者想要得到数字451,和666;code
import re
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.finditer("451zszxz666")
for it in mat:
print(it.group())
七 初学者使用正则表达式正确的姿式
初学者在使用正则表达式的时候不免会获得的匹配的结果与本身预期的不符合,能够借助一些在线工具匹配完成后再进行代码编写,经常使用的在线正则匹配测试以下;
在线工具
站长工具
-----以上就是本次分享:另外不少人在学习Python的过程当中,每每由于没有好的教程或者没人指导从而致使本身容易放弃,为此我建了个Python交流.裙 :一久武其而而流一思(数字的谐音)转换下能够找到了,里面有最新Python教程项目可拿,不懂的问题多跟里面的人交流,都会解决哦!本文的文字及图片来源于网络加上本身的想法,仅供学习、交流使用,不具备任何商业用途,版权归原做者全部,若有问题请及时联系咱们以做处理。