JS正则表达式元字符

时间 2019-11-06

原文原文链接

正则	描述	正则	描述
`\f`	匹配换页符	`\t`	匹配制表符
`\n`	匹配换行符	`\v`	匹配垂直制表符
`\r`	匹配回车	`\s`	匹配单个空格，等同于`[\f\n\r\t\v]`;
`\S`	表示非空格字符	`\d`	在正则中表示数字
`\w`	表示单词字符，等同于字符集合[a-zA-Z0-9_]	`\`	建立正则对象时，要转义
`+`	表示出现一到屡次	`^`	表示后边出现的数字必须在开头
`$`	表示前面出现的数字必须出如今结尾

视频教程php

g是模式修正符，表示在整个字符串里屡次查找前端

match方法来找到和reg正则相匹配的内容正则表达式

js"ab23839cd".match(/\d+/)

空白\s（包括空格回车制表符等）

\f匹配换页符，\n匹配换行符，\r匹配回车，\t匹配制表符，\v匹配垂直制表符。
\s匹配单个空格，等同于[\f\n\r\t\v]。例如：
例1：ide

jsvar reg = /\s.+/;
var str='This is a test String.';
alert(reg.exec(str));

返回“is a test String.”，正则的意思是匹配第一个空格以及其后的全部非换行字符。编码

一样，\S表示非空格字符。
例2：idea

jsvar reg = /\S+/;
var str='This is a test String.';
alert(reg.exec(str));

匹配结果为This，当遇到第一个空格以后，正则就中止匹配了。code

在正则中最经常使用到的一个是：
例3：var reg=/^\s*$/; //匹配任意空或空白字符，若是你什么也没输入，或输入的只有空格、回车、换行等字符，则匹配成功。这样就能够验证用户是否正确输入内容了。
这个用来验证输入框里是否写了有效效字符,用法以下：视频

jsvar  reg=/^\s*$/;
if(reg.test(value)){
  alert('请输入有效值');
  return false;
}

单字符\w

\w表示单词字符，等同于字符集合[a-zA-Z0-9_]。例如：对象

jsvar reg = /\w+/;
var str='zhufengpeixun';
alert(reg.exec(str));

返回完整的zhufengpeixun字符串，由于全部字符都是单词字符。教程

jsvar reg = /\w+/;
var str='.className';
alert(reg.exec(str));

结果显示匹配了字符串中的className，只有第一个“.”惟一的非单词字符没有匹配。

jsvar reg = /\w+/;
var str='正则教程';
alert(reg.exec(str));

试图用单词字符去匹配中文天然行不通了，返回 null。

\W表示非单词字符，等效于[^a-zA-Z0-9_]

jsvar reg = /\W+/;
var str='正则教程';
alert(reg.exec(str));

返回完整的字符串，由于，中文算做是非单词字符。

分组和分组的引用

请见在线视频的正则专题部分的
正则表达式基础第三讲：分组、分组的引用、选择等http://online.zhufengpeixun.cn/viewCourseDetail.do?courseId=141415

形式以下：/(子正则表达式)\1/ 依旧用例子来讲明：

1.例子

jsvar reg = /\w/;
var str='zhufengpeixun';
alert(reg.exec(str));
//返回z。

2.例子

jsvar reg = /(\w)(\w)/;
var str='zhufengpeixun';
alert(reg.exec(str));

返回zh,z,h ,zh是整个正则匹配的内容，z是第一个括号里的子正则表达式匹配的内容，h是第二个括号匹配的内容。

3.例子

jsvar reg = /(\w)\1/;
var str='zhufengpeixun';
alert(reg.exec(str));

则会返回null。这里的“\1”就叫作反向引用，它表示的是第一个括号内的子正则表达式匹配的内容。在上面的例子中，第一个括号里的(\w)匹配了z，所以“\1”就一样表示z了，在余下的字符串里天然找不到z了。与第二个例子对比就能够发现，“\1”是等同于“第1个括号匹配的内容”，而不是“第一个括号的内容”。

jsvar reg = /(\w)\1/;
var str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));

这个正则则会匹配到bb,b。一样，前面有几个子正则表达式咱们就可使用几个反向引用。例如：

jsvar reg = /(\w)(\w)\2\1/;
var str='woow';
alert(reg.exec(str));

会匹配成功，由于第一个括号匹配到w，第二个括号匹配到o，而\2\1则表示ow，刚好匹配了字符串的最后两个字符。

括号() ，表示子表达式，也叫分组

前面咱们曾经讨论过一次括号的问题，见下面这个例子：

jsvar reg = /^(b|c).+/;
var str='bbs.blueidea.com';
alert(reg.exec(str));

这个正则是为了实现只匹配以b或者c开头的字符串，一直匹配到换行字符，可是。上面咱们已经看到了，可使用“\1”来反向引用这个括号里的子正则表达式所匹配的内容。并且exec方法也会将这个字正则表达式的匹配结果保存到返回的结果中。

不记录子正则表达式的匹配结果[匹配不捕获]

使用形如(?:pattern)的正则就能够避免保存括号内的匹配结果。例如：

jsvar reg = /^(?:b|c).+/;
var str='bbs.blueidea.com';
alert(reg.exec(str));

能够看到返回的结果再也不包括那个括号内的字正则表达式多匹配的内容。同理，反向引用也很差使了：

jsvar reg = /^(b|c)\1/;
var str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));

返回bb,b。bb是整个正则表达式匹配的内容，而b是第一个子正则表达式匹配的内容。

jsvar reg = /^(?:b|c)\1/;
var str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));

返回null。因为根本就没有记录括号内匹配的内容，天然没有办法反向引用了。

正向预查

形式：(?=pattern)所谓正向预查，意思就是：要匹配的字符串，后面必须紧跟着pattern！咱们知道正则表达式/cainiao/会匹配cainiao。一样，也会匹配cainiao9中的cainiao。可是咱们可能但愿，cainiao只能匹配cainiao8中的cainiao。这时候就能够像下面这样写：/cainiao(?=8)/，看两个实例：

jsvar reg = /cainiao(?=8)/;
var  str='cainiao9';
alert(reg.exec(str));
//返回null。

jsvar reg = /cainiao(?=8)/;
var  str='cainiao8';
alert(reg.exec(str));

匹配cainiao。须要注意的是，括号里的内容并不参与真正的匹配，只是检查一下后面的字符是否符合要求而已，例如上面的正则，返回的是cainiao，而不是cainiao8。

再来看几个例子：

jsvar reg = /zhufeng(?=peixun)/;
var  str='zhufengpeixun';
alert(reg.exec(str));

匹配到zhufeng，而不是peixun。

jsvar reg = /zhufeng(?=peixun)/;
var str=’zhufengonline’;
alert(reg.exec(str));

返回null，由于zhufeng后面不是peixun。

jsvar reg = /zhufeng(?=peixun)/;
var str='onlinepeixun';
alert(reg.exec(str));

一样返回null。

?!

形式(?!pattern)和?=刚好相反，要求字符串的后面不能紧跟着某个pattern，还拿上面的例子：

jsvar reg = /zhufeng(?!js)/;
var str=`zhufengjs`;
alert(reg.exec(str));

返回null，由于正则要求，zhufeng的后面不能是js。

jsvar reg = /zhufeng(?!js)/;
var  str='zhufengpeixun';
alert(reg.exec(str));

则成功返回zhufeng。

匹配元字符

首先要搞清楚什么是元字符呢？咱们以前用过*,+,?之类的符号，它们在正则表达式中都有必定的特殊含义，相似这些有特殊功能的字符都叫作元字符。例如

jsvar reg = /c*/;

表示有任意个c，可是若是咱们真的想匹配c*这个字符串的时候怎么办呢？只要将*转义了就能够了，以下：

jsvar reg = /c\*/;
var str='c*';
alert(reg.exec(str));

返回匹配的字符串：c*。

同理，要匹配其余元字符，只要在前面加上一个“\”就能够了。

正则表达式的修饰符

全局匹配，修饰符g

形式：/pattern/g 例子：reg = /b/g; 后面再说这个g的做用。先看后面的两个修饰符。不区分大小写，修饰符i

形式：/pattern/i 例子：

jsvar reg = /b/;
var str = 'BBS';
alert(reg.exec(str));

返回null，由于大小写不符合。

jsvar reg = /b/i;
var str = 'BBS';
alert(reg.exec(str));

匹配到B，这个就是i修饰符的做用了。

行首行尾，修饰符m

形式：/pattern/m m修饰符的做用是修改^和$在正则表达式中的做用，让它们分别表示行首和行尾。例如：

jsvar reg = /^b/;
var str = 'test\nbbs';
alert(reg.exec(str));

匹配失败，由于字符串的开头没有b字符。可是加上m修饰符以后：

jsvar reg = /^b/m;
var str = 'test\nbbs';
alert(reg.exec(str));;

匹配到b，由于加了m修饰符以后，^已经表示行首，因为bbs在字符串第二行的行首，因此能够成功地匹配。

匹配固定的n个 c{n}

{1}表示一个的意思。/c{1}/只能匹配一个c，和/c/是一个意思，通常匹配只出现一次的字符，后边的{1}就不写了。/c{2}/则会匹配两个连续的c。以此类推, /c{n}/则会匹配n个连续的c。看下面的例子：

jsvar reg = /c{1}/;  
var str='china_zhufengpeixun';
alert(reg.exec(str));
//输出结果是：c

var reg = /o{2}/;  
var str='money';  
alert(reg.exec(str));
//返回结果`null`，表示没有匹配成功。

reg = /o{2}/;
str='good food';
alert(reg.exec(str))
//输出结果oo。（实际上是第一组oo，不会匹配到第二组oo，由于正则的匹配是懒惰的，不加模式匹配符g，则表示只去匹配一次，匹配到了则返回而且中止。

若是写成

jsreg=/o{2}/g;
alert(str.match(reg))
//则输出oo,oo了

c{m,n} 匹配最少m个，最多n个

c{3,4}的意思是，连续的3个c或者4个c。例如:

jsreg = /o{3,4}/;// (匹配三到四个o)
str='good正则教程';
alert(reg.exec(str));

返回结果null，表示没有匹配成功。例：

jsreg = /o{3,4}/;
str='goood正则教程';
alert(reg.exec(str));

弹出结果是：ooo。例：

jsreg = /o{3,4}/;
str='very gooood正则教程';
alert(reg.exec(str));

输出的结果是：oooo，这代表正则会尽可能多匹配，可3可4的时候它会选择多匹配一个。（这就是贪婪匹配）例：

jsreg = /c{3,4}/;
str='cccccTest';
alert(reg.exec(str));

仍然会匹配4个c。

由以上例子能够推断出：c{m,n}表示m到n个c，且m小于等于n。

c{n,}表示最少匹配n个c，最多不限制

c{1,}表示1个以上的c,至关于+。以下：

例：

jsreg = /c{1,}/;str='cainiao';
alert(reg.exec(str));
//结果弹出c。

例：

jsreg = /c{1,}/;
str='cccccTest';
alert(reg.exec(str));
//返回ccccc，再次说明了正则表达式会尽可能多地匹配。

例：

jsreg = /c{2,}/;
str='cainiao';
alert(reg.exec(str));

结果返回null，c{2,}表示2个以上的c，而cainiao中只有1个c。

由以上例子可知，c{n,}表示最少n个c，最多则不限个数。

综合：*,+,?

*表示0次或者屡次，等同于{0,}，即c* 和c{0,} 是一个意思。

+表示一次或者屡次，等同于{1,}，即c+ 和c{1,} 是一个意思。

最后，?表示0次或者1次，等同于{0,1}，即c? 和c{0,1} 是一个意思。

贪心与非贪心【贪婪匹配和非贪婪匹配】

人都是贪婪的，正则也是如此。咱们在例子reg = /c{3,4}/;str='ccccTest';的例子中已经看到了，能匹配四个的时候，正则绝对不会去匹配三个。上面所介绍的全部的正则都是这样，只要在合法的状况下，它们会尽可能多去匹配字符，这就叫作贪心模式。若是咱们但愿正则尽可能少地匹配字符，那么就能够在表示数字的符号后面加上一个?（即：问号加在量词的后边，则表示非贪婪匹配）。组成以下的形式：

js{n,}?, *?, +?, ??, {m,n}?

例：

jsreg = /c{1,}?/;
str='ccccc';
 alert(reg.exec(str));

返回的结果只有1个c，尽管有5个c能够匹配，可是因为正则表达式是非贪心模式，因此只会匹配一个。

/^开头,结尾$/ 【表示位置】

^表示只匹配字符串的开头。看下面的例子：

例1：

jsreg = /^c/;
str='维生素c';
alert(reg.exec(str));

结果为null，由于字符串‘维生素c’的开头并非c，因此匹配失败。

例2：

jsreg = /^z/;
str='zhufengpeixun';
alert(reg.exec(str));;

此次则返回c，匹配成功，由于cainiao偏偏是以z开头的。

与^相反，$则只匹配字符串结尾的字符，一样，看例子：

例3：

jsreg = /z$/;
str='zhufengpeixun';
alert(reg.exec(str));

输出null，表示正则表达式没能在字符串的结尾找到z这个字符。

例4：

jsreg = /d$/;
str='正则教程good';
alert(reg.exec(str));

此次返回的结果是d，代表匹配成功。

元字符点’.’的用法

.会匹配字符串中除了换行符\n以外的全部字符，例如

jsreg = /./; //一个点表示匹配字符串中出现的第一个非换行符字符。
str='zhufengpeixun';
alert(reg.exec(str));;

结果显示，正则匹配到了字符z。

jsreg = /./;
str='online.zhufengpeixun';
alert(reg.exec(str));

此次是o，只要有一个是非换行字符，就表示匹配成功，就不会往下再继续了。

jsreg = /.+/;
str='zhufengpeixun_  前端开发权威培训';
alert(reg.exec(str));

结果是“zhufengpeixun_前端开发“也就是说全部的字符都被匹配掉了，包括一个空格，一个下滑线

【贪婪匹配】。

例1：

jsreg = /.+/;
str='online.zhufengpeixun.cn';  
alert(reg.exec(str));;

一样，直接返回整个字符串——online.zhufengpeixun.cn，可见”.”也匹配”.”自己。

例2：

jsreg = /^./; //这样表示必须以非换行符开始。
str='\nzhufengpeixun';
alert(reg.exec(str));

结果是null，终于失败了，正则要求字符串的第一个字符不是换行，可是偏偏字符是以\n开始的。

“|“，正则表达式中的或，把“|”左右两边的一到多个字符当成一个总体对待

b|c表示，匹配b或者c（这里至关于[bc]）。ab|ac表示匹配ab或ac（但这里不至关于[abc]，[]表示在一组字符中任选一个）。

例1：

js/z|o/.exec('zhufengpeixun'))
//结果是z。

例2：

js/z|o/.exec('online');
//结果是o。

例3：

js/^z|o.+/.exec('online');
//匹配掉整个online。

例4：

js/^z|o.+/.exec('zhufengpeixun.cn');
//结果只有一个z，而不是整个字符串。由于上面正则表达式的意思是，匹配开头的z或者是o.+。

和括号结合使用

例：

js/^(z|o).+/.exec('zhufengpeixun');

此次的结果是整个串zhufengpeixun，加上上面的括号这后，这个正则的意思是，若是字符串的开头是z或者o，那么匹配开头的z或者o以及其后的全部的非换行字符。若是你也实验了的话，会发现返回的结果后面多出来一个“z“，这是()内的z|o所匹配的内容(这个叫分组或子正则)。咱们在正则表达式内括号里写的内容会被认为是子正则表达式，所匹配的结果也会被记录下来供后面使用。咱们暂且不去理会这个特性。

方括号的做用:[]

[abc]表示a或者b或者c中的任意一个字符。

例：

jsvar reg = /^[abc]/;
//这个有点像/^(a|b|c)/
str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));;
//返回结果是b。

例：

jsreg = /^[abc]/;
str='test';
alert(reg.exec(str));
//此次的结果就是null了。

咱们在字字符集合中使用以下的表示方式:[a-z],[A-Z],[0-9]，分别表示小写字母，大写字母，数字。例如：

jsreg = /^[a-zA-Z][a-zA-Z0-9_]+/;  
//后面这个其实这个就是元字符\w表示的含意
str='test';
alert(reg.exec(str));
//结果是整个test，正则的意思是开头必须是英文字母，后面能够是英文字母或者数字以及下划线。

关于正则中的连续字符

在正则中/[0-9]/表示匹配字符从0到9中的任意一个，/[a-z]/表示匹配从a到z中的任意一个字母只要是在ASCII码表里连续出现的字符，均可以用这样的表示法。

请百度一下“ASCII码表”，参照里面字符出现的顺序和对应的16进制或10进制的编码。

好比var reg=/^[!-z]$/; 就会匹配从字符“!”开始，到字符“z”结束的任意一个字符。

jsvar reg=/^[!-z]$/;
alert(reg.test("8"));//true,
alert(reg.test("*"))//true,
alert(reg.test("}"))//false,由于"}"不在从！到z的这个范围内

正则/^[!-z]$/也能够用16进制来表示。若是用16进制表示，则须要用\u开头，表示这是在以16进制的方式定义unicode字符，而且后边的16进制的编码要写成四位，不足4位的前边补0。则上边的那个正则，也能够写成

jsvar reg=/^[\u0021-\u007a]$/;
// 字符“！”对应的16进制编码是21，字符“z”的16进制编码是7a。

这种方式。中文是扩展的ASCII字符编码，匹配UTF8中文的正则是：/^[\u4e00-\u9fa5]+$/

php中utf-8编码下用正则表达式匹配汉字的正则是：/^[\x{4e00}-\x{9fa5}]+$/u

注意：写成[1-13]不是表示从数字1到数字13，而是表示从1到1和3，也就是1和3。由于正则里是在表示连续出现的字符，而不是数字。

反字符集合[^abc]

^在正则表达式开始部分的时候表示开头的意思，例如/^c/表示开头是c；可是在字符集和中，它表示的是相似“非“的意思，例如[^abc]就表示不能是a，b或者c中的任何一个。例如：

jsvar reg = /[^abc]/;
var str='blueidea';
alert(reg.exec(str));

返回的结果是l，由于它是第一个非abc的字符（即第一个b没有匹配）。一样：

例：

jsvar reg = /[^abc]/;
var str='cbazhufengpeixun';
alert(reg.exec(str));

输出z，前三个字符都是[abc]集合中的。由此咱们可知：[^0-9]表示非数字，[^a-z]表示非小写字母，依次类推。

边界与非边界

\b表示的边界的意思，也就是说，只有字符串的开头和结尾才算数。例如/\bc/就表示字符串开始的c。看下面的例子：

js/\bc/.exec('cainiao');
//返回结果c。匹配到了左边界的c字符。

js/\bc/.exec('???c');
//仍然返回c，不过此次返回的是右侧边界的c。

js/\bc/.exec('bcb');
//此次匹配失败，由于bcb字符串中的c被夹在中间，既不在左边界也再也不右边界。

与\b对应\B表示非边界。例如：

js/\Bc/.exec('bcb');
//此次会成功地匹配到bcb中的c，。然而

js/\Bc/.exec('cainiao');
//则会返回null。由于\B告诉正则，只匹配非边界的c。

数字与非数字

\d表示数字的意思，相反，\D表示非数字。

例：

js/\d/.exec('cainiao8')
//返回的匹配结果为8，由于它是第一个数字字符。

例：

js/\D/.exec('cainiao8');
//返回c，第一个非数字字符。