正则表达式-量词
1概述
所谓量词,能够理解为用来描述某个字符(字符组)重复出现的次数。举个例子,11位数的电话号码,若是不考虑前三位的固定组合,用正则表达式写成:
\d\d\d\d\d\d\d\d\d\d\d
其中d重复了11次,十分不方便,因此就引入了量词,上式能够轻松地写成:
\d{11}
量词也支持对长度描述范围,形如{m,n} m和n分别是两个整数,至关于数学中的[m,n],例如\d{1,11},表示这个数字字符串的长度最短1个字符,最长11个字符。java
【注意】{m,n}的n省略写成{m,} 表示字符出现最少m次,且没有上限。
2 经常使用量词表示
有几种技术人员经常使用的量词表示,产生出了至关于量词的简记策略。
3 点号
特殊的元字符 .(点号),点号能够匹配除了换行符n以外的全部字符,包括数字、字母各类符号等。若是须要匹配真正的全部字符的话,能够在设置单行模式匹配的状况下使用点号,或者使用第一章所讲,使用 [\s\S]。正则表达式
4 匹配优先量词
正则表达式中的量词能够分为几种类别,以前介绍的量词都是能够归为匹配优先量词,其匹配策略为:当不肯定是否要匹配时,先尝试匹配,再作后续动做。
由于有匹配优先的存在,对于通配符(除\n)点号就有可能匹配到本不应匹配到的部分(好比字符串的末尾),这时候就应该放弃本次匹配,让表达式的后一部分尝试匹配。这一个过程称为回溯。ide
5忽略优先量词
相反地,当不肯定时候要匹配时选择不匹配的称为忽略优先量词。先尝试用表达式后面的部分匹配,不符合时再作回溯操做。
上面提到的经常使用量词都是优先匹配的,它们都有忽略优先的对应量词,见下表:
【注意】对于忽略优先量词的转义包括先后两部分,即?的转义为\\? ,+?的转义为+\? ,??的转义为\?\?
喜欢这样文章的能够关注我,我会持续更新,大家的关注是我更新的动力!须要更多java学习资料的也能够私信我!学习