正则表达式贪婪模式

时间 2019-12-13

原文原文链接

+贪婪匹配与非贪婪匹配java

贪婪匹配
默认状况下，正则表达式使用最长匹配原则（也叫贪婪匹配原则）。
例如：要将"zoom"中匹配"zo?"的部分替换成"r",替换的的结果是"rom"。若是要将"zoom"中匹配"zo*" 的部分替换成"r",替换后的结果是"rm"。正则表达式

非贪婪匹配
当字符？紧随其余限定符（*、+、？、{n}、{n,}、{n,m}）以后时，匹配模式变成了最短匹配原则（也叫非贪婪匹配原则）。
例如：在字符串"fooood"中，"fo+?"只匹配"fo"部分，而"fo+"匹配"foooo部分。code

当正则表达式中包含能接受重复的限定符时，一般的行为是（在使整个表达式能获得匹配的前提下）匹配尽量多的字符。以这个表达式为例：a.*b，它将会匹配最长的以a开始，以b结束的字符串。若是用它来搜索aabab的话，它会匹配整个字符串aabab。这被称为贪婪匹配。字符串

有时，咱们更须要懒惰匹配，也就是匹配尽量少的字符。前面给出的限定符均可以被转化为懒惰匹配模式，只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复，可是在能使整个匹配成功的前提下使用最少的重复。如今看看懒惰版的例子吧：it

a.*?b 匹配最短的，以a开始，以b结束的字符串。若是把它应用于aabab的话，它会匹配aab和abclass

.*跟.*?的区别搜索

.*?匹配点前面的字符到问号后面字符最短的匹配，而.*则匹配到最后一个能匹配到的co

例子一、：匹配字符

<li title="中国人" name="外国人">中国人中国人</li>

正则以下：由于是匹配第一个双引号到接下来的双引号结束，不然若是用.*的话这个li有多个属性就一直匹配到最后一个属性的结束了ab

<li title=\"(.*?)\">([^<]*)</li>