正则匹配中的非贪婪匹配不是最短匹配

最近在工作中遇到一个需求,就是找出html中所有锚文字包含 联系方式 的超链接。刚开始我写了一个很简单的正则来解决这个问题<a.*?联系方式.*?</a。但是在测试的时候却发现这个正则表达式并不像我想象的那样工作。 图中给出了一个正则表达式匹配的例子,可以看出在这段文字中有两个匹配,但是第一个匹配所包含的结果已经超出了实际需要的范围,包含了太多的超链接标签,而我需要的是最短的匹配也就是图中横线画出
相关文章
相关标签/搜索