循环下的正则匹配?说说正则中的lastIndex

最近在使用正则匹配的时候,我遇到一个很是有意思的现象,代码以下所示:javascript

const reg = /\.jpg/g;
const arr = [
    'test1.jpg',
    'test2.jpg',
    'test3.jpg',
    'test4.jpg',
    'test5.jpg',
];
arr.map(item => console.log(reg.test(item)));

这段代码很好理解:它的规则就是判断字符串中是否含有.jpg,而后再循环地和数组中的字符串进行匹配,打印出结果。java

很显然这很是之简单嘛,输出的结果固然是全为true啦~数组

然而,图样图森破,它的结果是这样的:
图片描述spa

代码的执行结果很是神奇:它并无所有打印true,而是交替打印truefalse值,这究竟是为何?
为了查清楚究竟是怎么回事,我开始上网搜索相关资料,通过一番搜索后,发现正则并无咱们想象的那么简单...code


what's going on?

首先正则有一个属性叫lastIndex,它表示正则下一次匹配时的起始位置。通常状况下咱们是使用不到它的,但在正则中包含全局标志g时,正则的testexec方法就会使用到它,具体规则以下:blog

  • 初始状态下lastIndex的值为0
  • 若成功匹配,lastIndex的值就被更新成被匹配字符串后面的第一个字符的index,或者可理解为被匹配字符串的最后一个字符index + 1
  • 若匹配失败,lastIndex则被重置为0。
  • 若是咱们继续使用原先的正则进行下一轮匹配,它则会从字符串lastIndex的位置开始进行

为验证这个结论,我特地作了两个实验:图片

第一个就是直接将正则的lastIndex打印出来:ip

const reg = /\.jpg/g;
const arr = [
    'test1.jpg',
    'test2.jpg',
    'test3.jpg',
    'test4.jpg',
    'test5.jpg',
];
arr.map(item => console.log(reg.test(item), reg.lastIndex));

图片描述

第二个就对数组中的字符串稍做修改:字符串

const reg = /\.jpg/g;
const arr = [
    'test1.jpg',
    'longTest4.jpg',
    'test3.jpg',
    'longTest4.jpg',
    'test5.jpg',
];
arr.map(item => console.log(reg.test(item), reg.lastIndex));

经过两组实验的对比观察,发现确实如此:it

在第一个实验中,因为数组中字符串的长度都是一致的,成功匹配后lastIndex的值直接更新为9,下次匹配的时候直接从第10个字符开始(很明显根本就没第10个字符嘛),所以匹配失败,lastIndex重置为0。以此类推,最终以909的形式交替打印。

而第二个实验因为咱们增长了部分字符串的长度,所以对于第二、4个字符串而言,即便从第9个字符开始匹配,依然能匹配到后边的.jpg,故lastIndex继续更新到13


经过此次小小的实验,咱们发现使用正则的时候仍是要多加当心,对于testexec方法,最好仍是不要随意加上全局标志g

相关文章
相关标签/搜索