一篇文章带你玩转正则表达式

正则表达式

regular expression:RegExp正则表达式

用来处理字符串的规则算法

  • 只能处理字符串
  • 它是一个规则:能够验证字符串是否符合某个规则(test),也能够把字符串中符合规则的内容捕获到(exec / match...)
let str = "good good study , day day up!";
//=>学正则就是用来制定规则(是否包含数字)
let reg = /\d+/;
reg.test(str); //=>false
​
str = "2019-08-12";
reg.exec(str); //=>["2019",index:0,inputs:"原始字符串"]
复制代码

编写正则表达式

建立方式有两种

//=>字面量建立方式(两个斜杠之间包起来的,都是用来描述规则的元字符)
let reg1 = /\d+/;
​
//=>构造函数模式建立  两个参数:元字符字符串,修饰符字符串
let reg2 = new RegExp("\\d+");
复制代码

正则表达式由两部分组成

- 元字符

- 修饰符

/*经常使用的元字符*/
//=>1.量词元字符:设置出现的次数
* 零到屡次  
+ 一到屡次
? 零次或者一次
{n} 出现n次
{n,} 出现n到屡次
{n,m} 出现n到m次
​
//=>2.特殊元字符:单个或者组合在一块儿表明特殊的含义
\    转义字符(普通->特殊->普通)
.    除\n(换行符)之外的任意字符
^    以哪个元字符做为开始
$    以哪个元字符做为结束
\n   换行符
\d   0~9之间的一个数字
\D   非0~9之间的一个数字 (大写和小写的意思是相反的)
\w   数字、字母、下划线中的任意一个字符
\s   一个空白字符(包含空格、制表符、换页符等)
\t   一个制表符(一个TAB键:四个空格)
\b   匹配一个单词的边界
x|y  x或者y中的一个字符
[xyz] x或者y或者z中的一个字符
[^xy] 除了x/y之外的任意字符
[a-z] 指定a-z这个范围中的任意字符  [0-9a-zA-Z_]===\w
[^a-z] 上一个的取反“非”
()   正则中的分组符号
(?:) 只匹配不捕获
(?=) 正向预查
(?!) 负向预查 
​
//=>3.普通元字符:表明自己含义的
/zhangzhang/ 此正则匹配的就是 "zhangzhang"
复制代码
/*正则表达式经常使用的修饰符:img*/
i =>ignoreCase  忽略单词大小写匹配
m =>multiline   能够进行多行匹配
g =>global      全局匹配
​
/* 
/A/.test('lalala')  =>false
/A/i.test('lalala') =>true
*/
复制代码

元字符详细解析

^ $express

let reg = /^\d/;
console.log(reg.test("zhangzhang")); //=>false
console.log(reg.test("2019zhangzhang"));//=>true
console.log(reg.test("zhangzhang2019"));//=>false
复制代码
let reg = /\d$/;
console.log(reg.test("zhangzhang")); //=>false
console.log(reg.test("2019zhangzhang"));//=>false
console.log(reg.test("zhangzhang2019"));//=>true
复制代码
//=>^/$两个都不加:字符串中包含符合规则的内容便可
let reg1 = /\d+/;
//=>^/$两个都加:字符串只能是和规则一致的内容
let reg2 = /^\d+$/;
​
//=>举个例子:验证手机号码(11位,第一个数字是1便可)
let reg = /^1\d{10}$/;
复制代码

\数组

//=>.不是小数点,是除\n外的任意字符
let reg = /^2.3$/;
console.log(reg.test("2.3"));//=>true
console.log(reg.test("2@3"));//=>true
console.log(reg.test("23"));//=>false
​
//=>基于转义字符,让其只能表明小数点
reg = /^2\.3$/;
console.log(reg.test("2.3"));//=>true
console.log(reg.test("2@3"));//=>falselet str = "\\d";
reg = /^\d$/; //=>\d表明0-9的数字
console.log(reg.test(str)); //=>false
reg = /^\\d$/; //=>把特殊符合转换为普通的
console.log(reg.test(str)); //=>true
复制代码

x|ybash

let reg = /^18|29$/;
console.log(reg.test("18")); //=>true
console.log(reg.test("29")); //=>true
console.log(reg.test("129")); //=>true
console.log(reg.test("189")); //=>true
console.log(reg.test("1829")); //=>true
console.log(reg.test("829")); //=>true
console.log(reg.test("182")); //=>true
//---直接x|y会存在很乱的优先级问题,通常咱们写的时候都伴随着小括号进行分组,由于小括号改变处理的优先级 =>小括号:分组
reg = /^(18|29)$/;
console.log(reg.test("18")); //=>true
console.log(reg.test("29")); //=>true
console.log(reg.test("129")); //=>false
console.log(reg.test("189")); //=>false
//=>只能是18或者29中的一个了
复制代码

[]函数

//1.中括号中出现的字符通常都表明自己的含义
let reg = /^[@+]$/;
console.log(reg.test("@")); //=>true
console.log(reg.test("+")); //=>true
console.log(reg.test("@@")); //=>false
console.log(reg.test("@+")); //=>false
​
reg = /^[\d]$/; //=>\d在中括号中仍是0-9
console.log(reg.test("d"));//=>false
console.log(reg.test("\\"));//=>false
console.log(reg.test("9"));//=>true
​
//2.中括号中不存在多位数
reg = /^[18]$/;
console.log(reg.test("1")); //=>true
console.log(reg.test("8")); //=>true
console.log(reg.test("18")); //=>false
​
reg = /^[10-29]$/; //=>1或者0-2或者9
console.log(reg.test("1"));//=>true
console.log(reg.test("9"));//=>true
console.log(reg.test("0"));//=>true
console.log(reg.test("2"));//=>true
console.log(reg.test("10"));//=>false
复制代码

经常使用的正则表达式

1.验证是否为有效数字

/*
 * 规则分析
 * 1.可能出现 + - 号,也可能不出现  [+-]?
 * 2.一位0-9均可以,多位首位不能是0 (\d|([1-9]\d+))
 * 3.小数部分可能有可能没有,一旦有后面必须有小数点+数字 (\.\d+)?
 */
let reg = /^[+-]?(\d|([1-9]\d+))(\.\d+)?$/;
复制代码

2.验证密码

//=>数字、字母、下划线
//=>6~16位
let val = userPassInp.value,
    reg = /^\w{6,16}$/;
let flag=reg.test(val);
/*
function checkPass(val){
    if(val.length<6 || val.length>16){
        alert('长度必须介于6-16位之间!');
        return;
    }
    let area=['a','b'....'_']; //=>包含数字、字母、下划线
    for(let i=0;i<val.length;i++){
        let char=val[i];
        if(!area.includes(char)){
            alert('格式不正确!');
            return;
        }
    }
}
*/
复制代码

3.验证真实姓名的

/*
 * 1.汉字  /^[\u4E00-\u9FA5]$/
 * 2.名字长度 2~10位
 * 3.可能有译名 ·汉字  (·[\u4E00-\u9FA5]{2,10}){0,2}
 */
let reg = /^[\u4E00-\u9FA5]{2,10}(·[\u4E00-\u9FA5]{2,10}){0,2}$/;
复制代码

4.验证邮箱的

let reg = /^\w+((-\w+)|(\.\w+))*@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$/;
​
//=> \w+((-\w+)|(\.\w+))*
//1.开头是数字字母下划线(1到多位)
//2.还能够是 -数字字母下划线 或者 .数字字母下划线,总体零到屡次
//=>邮箱的名字由“数字、字母、下划线、-、.”几部分组成,可是-/.不能连续出现也不能做为开始
​
//=> @[A-Za-z0-9]+
//1.@后面紧跟着:数字、字母 (1-多位)
​
//=> ((\.|-)[A-Za-z0-9]+)*
//1.对@后面名字的补充
// 多域名     .com.cn
// 企业邮箱    zxt@zhufeng-peixun-office.com
​
//=> \.[A-Za-z0-9]+
//1. 这个匹配的是最后的域名(.com/.cn/.org/.edu/.net...)
复制代码

5.身份证号码

/*
 * 1. 一共18位
 * 2. 最后一位多是X
 *
 * 身份证前六位:省市县  130828
 * 中间八位:年月日
 * 最后四位:
 *   最后一位 => X或者数字
 *   倒数第二位 => 偶数 女  奇数 男
 *   其他的是通过算法算出来的
 */
//let reg = /^\d{17}(\d|X)$/;
//=>小括号分组的第二个做用:分组捕获,不只能够把大正则匹配的信息捕获到,还能够单独捕获到每一个小分组的内容
let reg = /^(\d{6})(\d{4})(\d{2})(\d{2})\d{2}(\d)(\d|X)$/;
reg.exec("130828199012040617"); //=>["130828199012040617", "130828", "1990", "12", "04", "1", "7"...] 捕获结果是数组,包含每个小分组单独获取的内容
复制代码

正则两种建立方式的区别

//=>构造函数由于传递的是字符串,\须要写两个才表明斜杠
let reg = /\d+/g;
reg = new RegExp("\\d+","g");
​
//=>正则表达是中的部份内容是变量存储的值
//1.两个斜杠中间包起来的都是元字符(若是正则中要包含某个变量的值,则不能使用字面量方式建立)
let type = "zhang";
reg = /^@"+type+"@$/; 
console.log(reg.test("@zhang@")); //=>false
console.log(reg.test('@"""typeeeee"@')); //=>true
//2.这种状况只能使用构造函数方式(由于它传递的规则是字符串,只有这样才能进行字符串拼接)
reg = new RegExp("^@"+type+"@$");
console.log(reg.test("@zhang@"));//=>true
复制代码

正则的捕获

实现正则捕获的办法

正则RegExp.prototype上的方法ui

  • execthis

  • testspa

  • 字符串String.prototype上支持正则表达式处理的方法.net

  • replace

  • match

  • splite

  • .......

let str = "zhangwen2019yangfan2020qihang2021";
let reg = /\d+/;
/*
 * 基于exec实现正则的捕获
 *   1.捕获到的结果是null或者一个数组
 *     第一项:本次捕获到的内容
 *     其他项:对应小分组本次单独捕获的内容
 *     index:当前捕获内容在字符串中的起始索引
 *     input:原始字符串
 *   2.每执行一次exec,只能捕获到一个符合正则规则的,可是默认状况下,咱们执行一百遍,获取的结果永远都是第一个匹配到的,其他的捕获不到
 *     =>“正则捕获的懒惰性”:默认只捕获第一个
 */
console.log(reg.exec(str)); //=>["2019", index: 7, input: "zhangwen2019yangfan2020qihang2021"]
console.log(reg.exec(str)); //=>["2019"...]
​
/*
//=>实现正则捕获的前提是:当前正则要和字符串匹配,若是不匹配捕获的结果是null
let reg = /^\d+$/;
console.log(reg.test(str)); //=>false
console.log(reg.exec(str)); //=>null
*/
复制代码

懒惰性的解决办法

let str = "zhangwen2019yangfan2020qihang2021";
/*
 * reg.lastIndex:当前正则下一次匹配的起始索引位置 
 *   懒惰性捕获的缘由:默认状况下lastIndex的值不会被修改,每一次都是从字符串开始位置查找,因此找到的永远只是第一个
 *   解决办法:全局修饰符g
 */
// let reg = /\d+/;
// console.log(reg.lastIndex); //=>0 下面匹配捕获是从STR索引零的位置开始找
// console.log(reg.exec(str));
// console.log(reg.lastIndex); //=>0 第一次匹配捕获完成,lastIndex没有改变,因此下一次exec依然是从字符串最开始找,找到的永远是第一个匹配到的
​
// let reg = /\d+/g;
// console.log(reg.exec(str)); //=>["2019"...]
// console.log(reg.lastIndex); //=>11 设置全局匹配修饰符g后,第一次匹配完,lastIndex会本身修改
// console.log(reg.exec(str)); //=>["2020"...]
// console.log(reg.lastIndex); //=>22
// console.log(reg.exec(str)); //=>["2021"...]
// console.log(reg.lastIndex); //=>32
// console.log(reg.exec(str)); //=>null 当所有捕获后,再次捕获的结果是null,可是lastIndex又回归了初始值零,再次捕获又从第一个开始了...
// console.log(reg.lastIndex); //=>0
// console.log(reg.exec(str)); //=>["2019"...]
​
// let reg = /\d+/g;
// if (reg.test(str)) {
//  //=>验证一下:只有正则和字符串匹配咱们在捕获
//  console.log(reg.lastIndex); //=>11 基于TEST匹配验证后,LASTINDEX已经被修改成第一次匹配后的结果,因此下一次捕获再也不从头开始了
//  console.log(reg.exec(str)); //=>["2020"...]
// }
​
//=>需求:编写一个方法execAll,执行一次能够把全部匹配的结果捕获到(前提正则必定要设置全局修饰符g)
~ function () {
    function execAll(str = "") {
        //=>str:要匹配的字符串
        //=>this:RegExp的实例(当前操做的正则)
        //=>进来后的第一件事,是验证当前正则是否设置了G,不设置则不能在进行循环捕获了,不然会致使死循环
        if (!this.global) return this.exec(str);
        //=>ARY存储最后全部捕获的信息  RES存储每一次捕获的内容(数组)
        let ary = [],
            res = this.exec(str);
        while (res) {
            //=>把每一次捕获的内容RES[0]存放到数组中
            ary.push(res[0]);
            //=>只要捕获的内容不为NULL,则继续捕获下去
            res = this.exec(str);
        }
        return ary.length === 0 ? null : ary;
    }
    RegExp.prototype.execAll = execAll;
}();
​
let reg = /\d+/g;
console.log(reg.execAll("众口2019@2020难调"));
//=>字符串中的MATCH方法,能够在执行一次的状况下,捕获到全部匹配的数据(前提:正则也得设置G才能够)
console.log("众口2019@2020难调".match(reg));
复制代码

正则的分组捕获

//=>身份证号码
let str = "130828199012040112";
let reg = /^(\d{6})(\d{4})(\d{2})(\d{2})\d{2}(\d)(?:\d|X)$/;
console.log(reg.exec(str));
console.log(str.match(reg));
//=>["130828199012040112", "130828", "1990", "12", "04", "1", index: 0, input: "130828199012040112"]
//=>第一项:大正则匹配的结果
//=>其他项:每个小分组单独匹配捕获的结果
//=>若是设置了分组(改变优先级),可是捕获的时候不须要单独捕获,能够基于?:来处理
复制代码
//=>既要捕获到{数字},也想单独的把数字也获取到,例如:第一次找到 {0} 还须要单独获取0
let str = "{0}年{1}月{2}日";
​
/*
//=>不设置g只匹配一次,exec和match获取的结果一致(既有大正则匹配的信息,也有小分组匹配的信息)
let reg = /\{(\d+)\}/;
console.log(reg.exec(str));
console.log(str.match(reg));
//["{0}", "0",...]
*/
​
let reg = /\{(\d+)\}/g;
//console.log(str.match(reg)); //=>["{0}", "{1}", "{2}"] 屡次匹配的状况下,match只能把大正则匹配的内容获取到,小分组匹配的信息没法获取
let aryBig=[],
    arySmall=[],
    res=reg.exec(str);
while(res){
    let [big,small]=res;
    aryBig.push(big);
    arySmall.push(small);
    res=reg.exec(str);
}
console.log(aryBig,arySmall); //=>["{0}", "{1}", "{2}"] ["0", "1", "2"]
复制代码
//=>分组的第三个做用:“分组引用”
let str = "book"; //=>"good""look""moon""foot"...
let reg = /^[a-zA-Z]([a-zA-Z])\1[a-zA-Z]$/; //=>分组引用就是经过“\数字”让其表明和对应分组出现如出一辙的内容
console.log(reg.test("book")); //=>true
console.log(reg.test("deep")); //=>true
console.log(reg.test("some")); //=>false
复制代码

正则捕获的贪婪性

let str = "众口2019@2020难调";
//=>正则捕获的贪婪性:默认状况下,正则捕获的时候,是按照当前正则所匹配的最长结果来获取的
let reg = /\d+/g;
console.log(str.match(reg)); //=>["2019","2020"]
​
//=>在量词元字符后面设置?:取消捕获时候的贪婪性(按照正则匹配的最短结果来获取)
reg = /\d+?/g;
console.log(str.match(reg)); //=>["2", "0", "1", "9", "2", "0", "2", "0"]
复制代码

问号在正则中的五大做用:

  • 问号左边是非量词元字符:自己表明量词元字符,出现零到一次
  • 问号左边是量词元字符:取消捕获时候的贪婪性
  • (?:) 只匹配不捕获
  • (?=) 正向预查
  • (?!) 负向预查

其它正则捕获的方法

1.test也能捕获(本意是匹配)

let str = "{0}年{1}月{2}日";
let reg = /\{(\d+)\}/g;
console.log(reg.test(str)); //=>true
console.log(RegExp.$1); //=>"0"
​
console.log(reg.test(str)); //=>true
console.log(RegExp.$1); //=>"1"
​
console.log(reg.test(str)); //=>true
console.log(RegExp.$1); //=>"2"
​
console.log(reg.test(str)); //=>false
console.log(RegExp.$1); //=>"2" 存储的是上次捕获的结果
​
//=>RegExp.$1~RegExp.$9:获取当前本次正则匹配后,第一个到第九个分组的信息
复制代码

2.replace 字符串中实现替换的方法(通常都是伴随正则一块儿使用的)

let str = "zhangzhang@2019|zhangzhang@2020";
//=>把"zhangzhang"替换成"张张"
//1.不用正则,执行一次只能替换一个
/*
str = str.replace("zhangzhang","张张").replace("zhangzhang","张张");
console.log(str);
*/
//2.使用正则会简单一点
str = str.replace(/zhangzhang/g,"张张");
console.log(str);
复制代码
let str = "zhangzhang@2019|zhangzhang@2020";
//=>把"zhangzhang"替换为"zhongkounantiao"
//str=str.replace("zhangzhang","zhongkounantiao").replace("zhangzhang","zhongkounantiao");
//"zhongkounantiao@2019|zhangzhang@2020" 每一次替换都是从字符串第一个位置开始找的(相似于正则捕获的懒惰性)
​
//=>基于正则g能够实现
str = str.replace(/zhangzhang/g,"zhongkounantiao");
复制代码

案例:把时间字符串进行处理

let time = "2019-08-13";
//=>变为"2019年08月13日"
let reg = /^(\d{4})-(\d{1,2})-(\d{1,2})$/;
​
//=>这样能够实现
//time = time.replace(reg,"$1$2$3日");
//console.log(time); //=>2019年08月13日
​
//=>还能够这样处理 [str].replace([reg],[function])
//1.首先拿REG和TIME进行匹配捕获,能匹配到几回就会把传递的函数执行几回(并且是匹配一次就执行一次)
//2.不只把方法执行,并且REPLACE还给方法传递了实参信息(和exec捕获的内容一致的信息:大正则匹配的内容,小分组匹配的信息....)
//3.在函数中咱们返回的是啥,就把当前大正则匹配的内容替换成啥
/*
time = time.replace(reg,(big,$1,$2,$3)=>{
    //=>这里的$1~$3是咱们本身设置的变量
    console.log(big,$1,$2,$3);
});
*/
time = time.replace(reg,(...arg)=>{
    let [,$1,$2,$3]=arg;
    $2.length<2?$2="0"+$2:null;
    $3.length<2?$3="0"+$3:null;
    return $1+"年"+$2+"月"+$3+"日";
});
复制代码

单词首字母大写

let str = "good good study,day day up!";
let reg = /\b([a-zA-Z])[a-zA-Z]*\b/g;
//=>函数被执行了六次,每一次都把正则匹配信息传递给函数
//=>每一次ARG:["good","g"] ["good","g"] ["study","s"]...
str = str.replace(reg,(...arg)=>{
    let [content,$1]=arg;
    $1=$1.toUpperCase();
    content=content.substring(1);
    return $1+content;
});
console.log(str); //=>"Good Good Study,Day Day Up!"
复制代码

验证一个字符串中那个字母出现的次数最多,多少次?

/*==(去重思惟)==*/
let str = "ruguoyouyitainwoyaoquliulang";
let obj = {};
[].forEach.call(str, char => {
    if (typeof obj[char] !== "undefined") {
        obj[char]++;
        return;
    }
    obj[char] = 1;
});
let max = 1,
    res = [];
for (let key in obj) {
    let item = obj[key];
    item > max ? max = item : null;
}
for (let key in obj) {
    let item = obj[key];
    if (item === max) {
        res.push(key);
    }
}
console.log(`出现次数最多的字符:${res},出现了${max}次`);
​
/*==排序==*/
let str = "ruguoyouyitainwoyaoquliulang";
str = str.split('').sort((a, b) => a.localeCompare(b)).join('');
let ary = str.match(/([a-zA-Z])\1+/g).sort((a, b) => b.length - a.length);
// console.log(ary); //=>["hhh", "uuu", "ee", "ii", "nn", "oo", "zz"]
let max = ary[0].length,
    res = [ary[0].substr(0, 1)];
for (let i = 1; i < ary.length; i++) {
    let item = ary[i];
    if (item.length < max) {
        break;
    }
    res.push(item.substr(0, 1));
}
console.log(`出现次数最多的字符:${res},出现了${max}次`);
​
/*==从最大到最小去试找==*/
let str = "ruguoyouyitainwoyaoquliulang",
    max = 0,
    res = [],
    flag = false;
str = str.split('').sort((a, b) => a.localeCompare(b)).join('');
for (let i = str.length; i > 0; i--) {
    let reg = new RegExp("([a-zA-Z])\\1{" + (i - 1) + "}", "g");
    str.replace(reg, (content, $1) => {
        res.push($1);
        max = i;
        flag = true;
    });
    if (flag) break;
}
console.log(`出现次数最多的字符:${res},出现了${max}次`);
复制代码

其它方法:formatTime 、 queryURLParams 、 millimeter

~ function () {
    /*
     * formatTime:时间字符串的格式化处理
     *   @params
     *     templete:[string] 咱们最后指望获取日期格式的模板
     *     模板规则:{0}->年  {1~5}->月日时分秒
     *   @return
     *     [string]格式化后的时间字符串
     *  by zhufengpeixun on 2019/08/13
     */
    function formatTime(templete = "{0}年{1}月{2}日 {3}时{4}分{5}秒") {
        let timeAry = this.match(/\d+/g);
        return templete.replace(/\{(\d+)\}/g, (...[, $1]) => {
            let time = timeAry[$1] || "00";
            return time.length < 2 ? "0" + time : time;
        });
    }
​
    /* 
     * queryURLParams:获取URL地址问号和面的参数信息(可能也包含HASH值)
     *   @params
     *   @return
     *     [object]把全部问号参数信息以键值对的方式存储起来而且返回
     * by zhufengpeixun on 2019/08/13
     */
    function queryURLParams() {
        let obj = {};
        this.replace(/([^?=&#]+)=([^?=&#]+)/g, (...[, $1, $2]) => obj[$1] = $2);
        this.replace(/#([^?=&#]+)/g, (...[, $1]) => obj['HASH'] = $1);
        return obj;
    }
​
    /* 
     * millimeter:实现大数字的千分符处理
     *   @params
     *   @return
     *     [string]千分符后的字符串
     * by zhufengpeixun on 2019/08/13
     */
    function millimeter() {
        return this.replace(/\d{1,3}(?=(\d{3})+$)/g, content => content + ',');
    }
    
    /* 扩展到内置类String.prototype上 */
    ["formatTime", "queryURLParams", "millimeter"].forEach(item => {
        String.prototype[item] = eval(item);
    });
}();
复制代码
相关文章
相关标签/搜索