正则表达式位数和零宽断言

时间 2019-11-11

原文原文链接

正则表达式位数和零宽断言

以前的文章里，已经给你们展现了正则的匹配流程，但愿你们可以好好回顾下。https://segmentfault.com/a/11...
下面咱们主要讨论两部分的内容：1. 正则表达式的位数，2. 零宽断言正则表达式

正则表达式的位数

在有须要正则表达式，很常见的操做就百度一下。看能不能找到知足我需求的。有时候你会找到的，好比手机校验，密码校验，邮箱校验。可是不少人每每都看不懂网上的正则的意思。这个就是学习正则的一个误区。
在我看来，咱们学习正则应该是：了解其匹配过程，再看懂正则表达式，最后才是本身写正则表达式。
下面主要讲的就是怎么看懂正则表达式。而看懂正则表达式的关键--表达式匹配的字符位数。
咱们拿例子来讲吧。segmentfault

// 第一个例子，表达式匹配4个字符，一个“非语法关键字”的字符会占一位。
var reg1 = /abcd/;

// 第一个例子, 表达式匹配了5个字符（先是ab，再是abc里的任意一个，接着是cd）。说明下：[]范围内的内容能占一位，无论里面放了多少东西都是或的意思。
var reg2 = /ab[abc]cd/;

// 第三个例子, 匹配了5个或以上（先是ab，再是abc里的任意一个，接着是c，最后是一个d或者不少个d），这类的功能相似的*，{1,5}
var reg3 = /ab[abc]cd+/;

// 第四个例子，匹配4个（三个字符abd，和一个[]）。  像^, $这类的标示位置的语法是不会占一个字符的，只是对位置的一些要求。
var reg4 = /^ab[abc]d$/

// 第五个例子（这个是个真实例子，不知道你们可否快速看清），匹配无数字符（首选匹配##item#七个字符，接着匹配任意字符的任意个，接着匹配字符#item##）
// 这个里面的？是不要贪婪模式，其实这里说是遇到第一个#item##。关于贪婪模式，但愿你们本身查阅下。
var reg5 = /((##item#)([\w|\W])+?(#item##))/

我是经过例子，想尽可能说的直白点，让你们更容易理解。我这里面的例子并无列全状况，若是你们有什么不理解的正则，不肯定里面匹配多少位数，欢迎在下面留言，我看到就会给你们解答。
下面咱们说说零宽断言工具

零宽断言

在说清楚零宽断言，咱们须要简单介绍下为啥会有这个。它的存在是为了解决什么问题呢？
这个存在是解决咱们一些特定的要求，且不须要展占位数。好比：字符串的开头和结尾用"#"替换（/^|$/, 须要找到开头和结尾，又没有真实字符），数字字符串每隔三位添加一个逗号，字符串里b的后面不能是数字等等，这些都是对位置的条件，但这些条件自己又没有占位。学习

表示位置，又不占字符的语法总共就这些：^ $ \b \B (?=) (?!)
^（脱字符）匹配开头，在多行匹配中匹配行开头。
$（美圆符号）匹配结尾，在多行匹配中匹配行结尾。
b是单词边界，具体就是w和W之间的位置，也包括w和^之间的位置，也包括w和$之间的位置。
B就是b的反面的意思，非单词边界。例如在字符串中全部位置中，扣掉b，剩下的都是B的。
以上4个比较简单，尤为是^ 和$，这里就很少说了。下面主要说说这两个（？=）和（？！）
（？= P）表示的此刻位置后面应该是P模式，这个模式不仅仅是字符，也多是复杂正则。好比（？= l），（？= [abc]ede）, (?= \d +)
(?!p) 表示的此刻位置后面应该是P模式的之外的位置，和上一个正好相反。
举几个例子帮助理解下spa

// 第一个例子， 正则的表达式，要求在cate后位置的后面应该是一个数字。再以后应该是数字位，再以后是ok。\d是不能少的，也很好的说明了（？=）是不占位。
var reg6 = /cate(?=\d)\dok/
var str = 'cate3ok'
str.match(reg6); // cate3ok

// 第二个例子，若是咱们想在##p#和#p##以前的字符串里有ok字符这段字符串。
var reg7 = /##p#(?=.*ok).*#p##/
var str1 = '##p#fsdfsdokdfsdfs#p##'
reg7.test(str1);

// 第三个例子，若是咱们想在##p#和#p##以前的字符串里有ok字符这段字符串。若是字符串里有两段##p#怎么办呢？
var reg7 = /##p#(?=.*ok).*#p##/
var str1 = '##p#fsokfs#p####p#fsfs#p##'
str1.match(reg7) // ##p#fsokfs#p####p#fsfs#p##   这个结果就不是咱们想要的了。不知你们可否想明白？

// 咱们把正则改下
var reg8 = /##p#(?=.*ok).*?#p##/
str1.match(reg8) //##p#fsokfs#p##
// 好像是对了哦，可是咱们把字符串改下, 两段##p#换个位置
var str2 = '##p#fsfs#p####p#fsokfs#p##';
str2.match(reg8) // ##p#fsfs#p##  又不对了。 这个地方不知可否想明白。

// 咱们再把正则改下
var reg9 = /##p#(?=(.(?!#p##))*ok).*?#p##/;
str2.match(reg9); // ##p#fsokfs#p##  此次就对上了。

我想对最后的正则进行解释下。首选是?#p## 这个地方的？是告诉正则我不用贪婪模式，(?=(.(?!#p##)).*ok).* 这部分里咱们先不看里面的？部分,把它当成P（？=p.*ok）.*, 这部分意思，咱们须要任意字符，在任意字符的后面任意位置应该出现一个OK。最后里面的？部分，其实也是对这个任意字符的条件，要求任意字符后面不能是#p##字符串。这样就实现了啦。code

我知道这个可能很难理解清楚，但愿你们仍是多看看，多想一想。若是有问题，仍是欢迎下面留言。blog

关注

欢迎关注小站小滑轮，小站都是平时工做中积累的一些小工具。是否是大家工做中也会遇到呢。关于小站的内容也能够在博客下面留言哦。有什么使用的工具想让我补充，也能够留言。
ip