吃透此篇 正则就够javascript
regular expression:RegExpjava
用来处理字符串的规则正则表达式
- 只能处理字符串
- 它是一个规则:能够验证字符串是否符合某个规则(test),也能够把字符串中符合规则的内容捕获到(exec / match...)
let str = "good good study , day day up!"; //=>学正则就是用来制定规则(是否包含数字) let reg = /\d+/; reg.test(str); //=>false str = "2019-08-12"; reg.exec(str); //=>["2019",index:0,inputs:"原始字符串"] 复制代码
编写正则表达式算法
//=>字面量建立方式(两个斜杠之间包起来的,都是用来描述规则的元字符) let reg1 = /\d+/; //=>构造函数模式建立 两个参数:元字符字符串,修饰符字符串 let reg2 = new RegExp("\\d+"); 复制代码
/*经常使用的元字符*/ //=>1.量词元字符:设置出现的次数 * 零到屡次 + 一到屡次 ? 零次或者一次 {n} 出现n次 {n,} 出现n到屡次 {n,m} 出现n到m次 //=>2.特殊元字符:单个或者组合在一块儿表明特殊的含义 \ 转义字符(普通->特殊->普通) . 除\n(换行符)之外的任意字符 ^ 以哪个元字符做为开始 $ 以哪个元字符做为结束 \n 换行符 \d 0~9之间的一个数字 \D 非0~9之间的一个数字 (大写和小写的意思是相反的) \w 数字、字母、下划线中的任意一个字符 \s 一个空白字符(包含空格、制表符、换页符等) \t 一个制表符(一个TAB键:四个空格) \b 匹配一个单词的边界 x|y x或者y中的一个字符 [xyz] x或者y或者z中的一个字符 [^xy] 除了x/y之外的任意字符 [a-z] 指定a-z这个范围中的任意字符 [0-9a-zA-Z_]===\w [^a-z] 上一个的取反“非” () 正则中的分组符号 (?:) 只匹配不捕获 (?=) 正向预查 (?!) 负向预查 //=>3.普通元字符:表明自己含义的 /zhufeng/ 此正则匹配的就是 "zhufeng" 复制代码
/*正则表达式经常使用的修饰符:img*/ i =>ignoreCase 忽略单词大小写匹配 m =>multiline 能够进行多行匹配 g =>global 全局匹配 /* /A/.test('lalala') =>false /A/i.test('lalala') =>true */ 复制代码
^ $
express
let reg = /^\d/; console.log(reg.test("zhufeng")); //=>false console.log(reg.test("2019zhufeng"));//=>true console.log(reg.test("zhufeng2019"));//=>false 复制代码
let reg = /\d$/; console.log(reg.test("zhufeng")); //=>false console.log(reg.test("2019zhufeng"));//=>false console.log(reg.test("zhufeng2019"));//=>true 复制代码
//=>^/$两个都不加:字符串中包含符合规则的内容便可 let reg1 = /\d+/; //=>^/$两个都加:字符串只能是和规则一致的内容 let reg2 = /^\d+$/; //=>举个例子:验证手机号码(11位,第一个数字是1便可) let reg = /^1\d{10}$/; 复制代码
\
数组
//=>.不是小数点,是除\n外的任意字符 let reg = /^2.3$/; console.log(reg.test("2.3"));//=>true console.log(reg.test("2@3"));//=>true console.log(reg.test("23"));//=>false //=>基于转义字符,让其只能表明小数点 reg = /^2\.3$/; console.log(reg.test("2.3"));//=>true console.log(reg.test("2@3"));//=>false let str = "\\d"; reg = /^\d$/; //=>\d表明0-9的数字 console.log(reg.test(str)); //=>false reg = /^\\d$/; //=>把特殊符合转换为普通的 console.log(reg.test(str)); //=>true 复制代码
x|y
markdown
let reg = /^18|29$/; console.log(reg.test("18")); //=>true console.log(reg.test("29")); //=>true console.log(reg.test("129")); //=>true console.log(reg.test("189")); //=>true console.log(reg.test("1829")); //=>true console.log(reg.test("829")); //=>true console.log(reg.test("182")); //=>true //---直接x|y会存在很乱的优先级问题,通常咱们写的时候都伴随着小括号进行分组,由于小括号改变处理的优先级 =>小括号:分组 reg = /^(18|29)$/; console.log(reg.test("18")); //=>true console.log(reg.test("29")); //=>true console.log(reg.test("129")); //=>false console.log(reg.test("189")); //=>false //=>只能是18或者29中的一个了 复制代码
[]
函数
//1.中括号中出现的字符通常都表明自己的含义 let reg = /^[@+]$/; console.log(reg.test("@")); //=>true console.log(reg.test("+")); //=>true console.log(reg.test("@@")); //=>false console.log(reg.test("@+")); //=>false reg = /^[\d]$/; //=>\d在中括号中仍是0-9 console.log(reg.test("d"));//=>false console.log(reg.test("\\"));//=>false console.log(reg.test("9"));//=>true //2.中括号中不存在多位数 reg = /^[18]$/; console.log(reg.test("1")); //=>true console.log(reg.test("8")); //=>true console.log(reg.test("18")); //=>false reg = /^[10-29]$/; //=>1或者0-2或者9 console.log(reg.test("1"));//=>true console.log(reg.test("9"));//=>true console.log(reg.test("0"));//=>true console.log(reg.test("2"));//=>true console.log(reg.test("10"));//=>false 复制代码
验证是否为有效数字oop
/* * 规则分析 * 1.可能出现 + - 号,也可能不出现 [+-]? * 2.一位0-9均可以,多位首位不能是0 (\d|([1-9]\d+)) * 3.小数部分可能有可能没有,一旦有后面必须有小数点+数字 (\.\d+)? */ let reg = /^[+-]?(\d|([1-9]\d+))(\.\d+)?$/; 复制代码
验证密码this
//=>数字、字母、下划线 //=>6~16位 let val = userPassInp.value, reg = /^\w{6,16}$/; let flag=reg.test(val); /* function checkPass(val){ if(val.length<6 || val.length>16){ alert('长度必须介于6-16位之间!'); return; } let area=['a','b'....'_']; //=>包含数字、字母、下划线 for(let i=0;i<val.length;i++){ let char=val[i]; if(!area.includes(char)){ alert('格式不正确!'); return; } } } */ 复制代码
验证真实姓名的
/* * 1.汉字 /^[\u4E00-\u9FA5]$/ * 2.名字长度 2~10位 * 3.可能有译名 ·汉字 (·[\u4E00-\u9FA5]{2,10}){0,2} */ let reg = /^[\u4E00-\u9FA5]{2,10}(·[\u4E00-\u9FA5]{2,10}){0,2}$/; 复制代码
验证邮箱的
let reg = /^\w+((-\w+)|(\.\w+))*@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$/; //=> \w+((-\w+)|(\.\w+))* //1.开头是数字字母下划线(1到多位) //2.还能够是 -数字字母下划线 或者 .数字字母下划线,总体零到屡次 //=>邮箱的名字由“数字、字母、下划线、-、.”几部分组成,可是-/.不能连续出现也不能做为开始 //=> @[A-Za-z0-9]+ //1.@后面紧跟着:数字、字母 (1-多位) //=> ((\.|-)[A-Za-z0-9]+)* //1.对@后面名字的补充 // 多域名 .com.cn // 企业邮箱 zxt@zhufeng-peixun-office.com //=> \.[A-Za-z0-9]+ //1. 这个匹配的是最后的域名(.com/.cn/.org/.edu/.net...) 复制代码
身份证号码
/* * 1. 一共18位 * 2. 最后一位多是X * * 身份证前六位:省市县 130828 * 中间八位:年月日 * 最后四位: * 最后一位 => X或者数字 * 倒数第二位 => 偶数 女 奇数 男 * 其他的是通过算法算出来的 */ //let reg = /^\d{17}(\d|X)$/; //=>小括号分组的第二个做用:分组捕获,不只能够把大正则匹配的信息捕获到,还能够单独捕获到每一个小分组的内容 let reg = /^(\d{6})(\d{4})(\d{2})(\d{2})\d{2}(\d)(\d|X)$/; reg.exec("130828199012040617"); //=>["130828199012040617", "130828", "1990", "12", "04", "1", "7"...] 捕获结果是数组,包含每个小分组单独获取的内容 复制代码
正则两种建立方式的区别
//=>构造函数由于传递的是字符串,\须要写两个才表明斜杠 let reg = /\d+/g; reg = new RegExp("\\d+","g"); //=>正则表达是中的部份内容是变量存储的值 //1.两个斜杠中间包起来的都是元字符(若是正则中要包含某个变量的值,则不能使用字面量方式建立) let type = "zhueng"; reg = /^@"+type+"@$/; console.log(reg.test("@zhufeng@")); //=>false console.log(reg.test('@"""typeeeee"@')); //=>true //2.这种状况只能使用构造函数方式(由于它传递的规则是字符串,只有这样才能进行字符串拼接) reg = new RegExp("^@"+type+"@$"); console.log(reg.test("@zhufeng@"));//=>true 复制代码
实现正则捕获的办法
- 正则RegExp.prototype上的方法
- exec
- test
- 字符串String.prototype上支持正则表达式处理的方法
- replace
- match
- splite
- .......
let str = "zhufeng2019yangfan2020qihang2021"; let reg = /\d+/; /* * 基于exec实现正则的捕获 * 1.捕获到的结果是null或者一个数组 * 第一项:本次捕获到的内容 * 其他项:对应小分组本次单独捕获的内容 * index:当前捕获内容在字符串中的起始索引 * input:原始字符串 * 2.每执行一次exec,只能捕获到一个符合正则规则的,可是默认状况下,咱们执行一百遍,获取的结果永远都是第一个匹配到的,其他的捕获不到 * =>“正则捕获的懒惰性”:默认只捕获第一个 */ console.log(reg.exec(str)); //=>["2019", index: 7, input: "zhufeng2019yangfan2020qihang2021"] console.log(reg.exec(str)); //=>["2019"...] /* //=>实现正则捕获的前提是:当前正则要和字符串匹配,若是不匹配捕获的结果是null let reg = /^\d+$/; console.log(reg.test(str)); //=>false console.log(reg.exec(str)); //=>null */ 复制代码
let str = "zhufeng2019yangfan2020qihang2021"; /* * reg.lastIndex:当前正则下一次匹配的起始索引位置 * 懒惰性捕获的缘由:默认状况下lastIndex的值不会被修改,每一次都是从字符串开始位置查找,因此找到的永远只是第一个 * 解决办法:全局修饰符g */ // let reg = /\d+/; // console.log(reg.lastIndex); //=>0 下面匹配捕获是从STR索引零的位置开始找 // console.log(reg.exec(str)); // console.log(reg.lastIndex); //=>0 第一次匹配捕获完成,lastIndex没有改变,因此下一次exec依然是从字符串最开始找,找到的永远是第一个匹配到的 // let reg = /\d+/g; // console.log(reg.exec(str)); //=>["2019"...] // console.log(reg.lastIndex); //=>11 设置全局匹配修饰符g后,第一次匹配完,lastIndex会本身修改 // console.log(reg.exec(str)); //=>["2020"...] // console.log(reg.lastIndex); //=>22 // console.log(reg.exec(str)); //=>["2021"...] // console.log(reg.lastIndex); //=>32 // console.log(reg.exec(str)); //=>null 当所有捕获后,再次捕获的结果是null,可是lastIndex又回归了初始值零,再次捕获又从第一个开始了... // console.log(reg.lastIndex); //=>0 // console.log(reg.exec(str)); //=>["2019"...] // let reg = /\d+/g; // if (reg.test(str)) { // //=>验证一下:只有正则和字符串匹配咱们在捕获 // console.log(reg.lastIndex); //=>11 基于TEST匹配验证后,LASTINDEX已经被修改成第一次匹配后的结果,因此下一次捕获再也不从头开始了 // console.log(reg.exec(str)); //=>["2020"...] // } //=>需求:编写一个方法execAll,执行一次能够把全部匹配的结果捕获到(前提正则必定要设置全局修饰符g) ~ function () { function execAll(str = "") { //=>str:要匹配的字符串 //=>this:RegExp的实例(当前操做的正则) //=>进来后的第一件事,是验证当前正则是否设置了G,不设置则不能在进行循环捕获了,不然会致使死循环 if (!this.global) return this.exec(str); //=>ARY存储最后全部捕获的信息 RES存储每一次捕获的内容(数组) let ary = [], res = this.exec(str); while (res) { //=>把每一次捕获的内容RES[0]存放到数组中 ary.push(res[0]); //=>只要捕获的内容不为NULL,则继续捕获下去 res = this.exec(str); } return ary.length === 0 ? null : ary; } RegExp.prototype.execAll = execAll; }(); let reg = /\d+/g; console.log(reg.execAll("珠峰2019@2020培训")); //=>字符串中的MATCH方法,能够在执行一次的状况下,捕获到全部匹配的数据(前提:正则也得设置G才能够) console.log("珠峰2019@2020培训".match(reg)); 复制代码
//=>身份证号码 let str = "130828199012040112"; let reg = /^(\d{6})(\d{4})(\d{2})(\d{2})\d{2}(\d)(?:\d|X)$/; console.log(reg.exec(str)); console.log(str.match(reg)); //=>["130828199012040112", "130828", "1990", "12", "04", "1", index: 0, input: "130828199012040112"] //=>第一项:大正则匹配的结果 //=>其他项:每个小分组单独匹配捕获的结果 //=>若是设置了分组(改变优先级),可是捕获的时候不须要单独捕获,能够基于?:来处理 复制代码
//=>既要捕获到{数字},也想单独的把数字也获取到,例如:第一次找到 {0} 还须要单独获取0 let str = "{0}年{1}月{2}日"; /* //=>不设置g只匹配一次,exec和match获取的结果一致(既有大正则匹配的信息,也有小分组匹配的信息) let reg = /\{(\d+)\}/; console.log(reg.exec(str)); console.log(str.match(reg)); //["{0}", "0",...] */ let reg = /\{(\d+)\}/g; //console.log(str.match(reg)); //=>["{0}", "{1}", "{2}"] 屡次匹配的状况下,match只能把大正则匹配的内容获取到,小分组匹配的信息没法获取 let aryBig=[], arySmall=[], res=reg.exec(str); while(res){ let [big,small]=res; aryBig.push(big); arySmall.push(small); res=reg.exec(str); } console.log(aryBig,arySmall); //=>["{0}", "{1}", "{2}"] ["0", "1", "2"] 复制代码
//=>分组的第三个做用:“分组引用” let str = "book"; //=>"good"、"look"、"moon"、"foot"... let reg = /^[a-zA-Z]([a-zA-Z])\1[a-zA-Z]$/; //=>分组引用就是经过“\数字”让其表明和对应分组出现如出一辙的内容 console.log(reg.test("book")); //=>true console.log(reg.test("deep")); //=>true console.log(reg.test("some")); //=>false 复制代码
let str = "珠峰2019@2020培训"; //=>正则捕获的贪婪性:默认状况下,正则捕获的时候,是按照当前正则所匹配的最长结果来获取的 let reg = /\d+/g; console.log(str.match(reg)); //=>["2019","2020"] //=>在量词元字符后面设置?:取消捕获时候的贪婪性(按照正则匹配的最短结果来获取) reg = /\d+?/g; console.log(str.match(reg)); //=>["2", "0", "1", "9", "2", "0", "2", "0"] 复制代码
test也能捕获(本意是匹配)
let str = "{0}年{1}月{2}日"; let reg = /\{(\d+)\}/g; console.log(reg.test(str)); //=>true console.log(RegExp.$1); //=>"0" console.log(reg.test(str)); //=>true console.log(RegExp.$1); //=>"1" console.log(reg.test(str)); //=>true console.log(RegExp.$1); //=>"2" console.log(reg.test(str)); //=>false console.log(RegExp.$1); //=>"2" 存储的是上次捕获的结果 //=>RegExp.$1~RegExp.$9:获取当前本次正则匹配后,第一个到第九个分组的信息 复制代码
replace 字符串中实现替换的方法(通常都是伴随正则一块儿使用的)
let str = "zhufeng@2019|zhufeng@2020"; //=>把"zhufeng"替换成"珠峰" //1.不用正则,执行一次只能替换一个 /* str = str.replace("zhufeng","珠峰").replace("zhufeng","珠峰"); console.log(str); */ //2.使用正则会简单一点 str = str.replace(/zhufeng/g,"珠峰"); console.log(str); 复制代码
let str = "zhufeng@2019|zhufeng@2020"; //=>把"zhufeng"替换为"zhufengpeixun" //str=str.replace("zhufeng","zhufengpeixun").replace("zhufeng","zhufengpeixun"); //"zhufengpeixunpeixun@2019|zhufeng@2020" 每一次替换都是从字符串第一个位置开始找的(相似于正则捕获的懒惰性) //=>基于正则g能够实现 str = str.replace(/zhufeng/g,"zhufengpeixun"); 复制代码
let time = "2019-08-13"; //=>变为"2019年08月13日" let reg = /^(\d{4})-(\d{1,2})-(\d{1,2})$/; //=>这样能够实现 //time = time.replace(reg,"$1年$2月$3日"); //console.log(time); //=>2019年08月13日 //=>还能够这样处理 [str].replace([reg],[function]) //1.首先拿REG和TIME进行匹配捕获,能匹配到几回就会把传递的函数执行几回(并且是匹配一次就执行一次) //2.不只把方法执行,并且REPLACE还给方法传递了实参信息(和exec捕获的内容一致的信息:大正则匹配的内容,小分组匹配的信息....) //3.在函数中咱们返回的是啥,就把当前大正则匹配的内容替换成啥 /* time = time.replace(reg,(big,$1,$2,$3)=>{ //=>这里的$1~$3是咱们本身设置的变量 console.log(big,$1,$2,$3); }); */ time = time.replace(reg,(...arg)=>{ let [,$1,$2,$3]=arg; $2.length<2?$2="0"+$2:null; $3.length<2?$3="0"+$3:null; return $1+"年"+$2+"月"+$3+"日"; }); 复制代码
let str = "good good study,day day up!"; let reg = /\b([a-zA-Z])[a-zA-Z]*\b/g; //=>函数被执行了六次,每一次都把正则匹配信息传递给函数 //=>每一次ARG:["good","g"] ["good","g"] ["study","s"]... str = str.replace(reg,(...arg)=>{ let [content,$1]=arg; $1=$1.toUpperCase(); content=content.substring(1); return $1+content; }); console.log(str); //=>"Good Good Study,Day Day Up!" 复制代码
/*==(去重思惟)==*/ let str = "zhufengpeixunzhoulaoshi"; let obj = {}; [].forEach.call(str, char => { if (typeof obj[char] !== "undefined") { obj[char]++; return; } obj[char] = 1; }); let max = 1, res = []; for (let key in obj) { let item = obj[key]; item > max ? max = item : null; } for (let key in obj) { let item = obj[key]; if (item === max) { res.push(key); } } console.log(`出现次数最多的字符:${res},出现了${max}次`); /*==排序==*/ let str = "zhufengpeixunzhoulaoshi"; str = str.split('').sort((a, b) => a.localeCompare(b)).join(''); // console.log(str);//=>"aeefghhhiilnnoopsuuuxzz" let ary = str.match(/([a-zA-Z])\1+/g).sort((a, b) => b.length - a.length); // console.log(ary); //=>["hhh", "uuu", "ee", "ii", "nn", "oo", "zz"] let max = ary[0].length, res = [ary[0].substr(0, 1)]; for (let i = 1; i < ary.length; i++) { let item = ary[i]; if (item.length < max) { break; } res.push(item.substr(0, 1)); } console.log(`出现次数最多的字符:${res},出现了${max}次`); /*==从最大到最小去试找==*/ let str = "zhufengpeixunzhoulaoshi", max = 0, res = [], flag = false; str = str.split('').sort((a, b) => a.localeCompare(b)).join(''); for (let i = str.length; i > 0; i--) { let reg = new RegExp("([a-zA-Z])\\1{" + (i - 1) + "}", "g"); str.replace(reg, (content, $1) => { res.push($1); max = i; flag = true; }); if (flag) break; } console.log(`出现次数最多的字符:${res},出现了${max}次`); 复制代码
~ function () { /* * formatTime:时间字符串的格式化处理 * @params * templete:[string] 咱们最后指望获取日期格式的模板 * 模板规则:{0}->年 {1~5}->月日时分秒 * @return * [string]格式化后的时间字符串 * by zhufengpeixun on 2019/08/13 */ function formatTime(templete = "{0}年{1}月{2}日 {3}时{4}分{5}秒") { let timeAry = this.match(/\d+/g); return templete.replace(/\{(\d+)\}/g, (...[, $1]) => { let time = timeAry[$1] || "00"; return time.length < 2 ? "0" + time : time; }); } /* * queryURLParams:获取URL地址问号和面的参数信息(可能也包含HASH值) * @params * @return * [object]把全部问号参数信息以键值对的方式存储起来而且返回 * by zhufengpeixun on 2019/08/13 */ function queryURLParams() { let obj = {}; this.replace(/([^?=&#]+)=([^?=&#]+)/g, (...[, $1, $2]) => obj[$1] = $2); this.replace(/#([^?=&#]+)/g, (...[, $1]) => obj['HASH'] = $1); return obj; } /* * millimeter:实现大数字的千分符处理 * @params * @return * [string]千分符后的字符串 * by zhufengpeixun on 2019/08/13 */ function millimeter() { return this.replace(/\d{1,3}(?=(\d{3})+$)/g, content => content + ','); } /* 扩展到内置类String.prototype上 */ ["formatTime", "queryURLParams", "millimeter"].forEach(item => { String.prototype[item] = eval(item); }); }(); 复制代码
最后一句 若有帮助加个关注呗
不善言辞 干货十足 作人不要太正则