正则表达式,看完这篇仍是不够的。

时间 2019-11-12

标签正则表达式看完仍是不够栏目正则表达式繁體版

原文原文链接

看了好几回正则表达式，稍微碰到复杂的仍是看不懂。html

不少文章宣称，看完这编就够了。够了，真是够了，有多少人看完仍是不会复杂表达式？大部分文章都没有去分析复杂例子，没有写任何体会。把教材基本语法说一说，就敢宣称，你懂了。java

配合在线练习来学习。github

此次认真根据每一个语法符号作了几个例子，比较清晰了。记录几点要点。正则表达式

最基本要记住，正则表达式能够称为，贪婪获得子字符串的表达式。windows

1.正则表达式的基本目的就是查找目标字符串中符合表达式的 ‘子字符串’。app

1.1明确这个很重要。由于不一样的语言会给表达式类附加不少功能和函数。match,find.等等。这些功能都是从这个基本目的引伸出来的。千万别忘记了这些功能都是基于正则表达式的基本目的。ide

1.2并且明确了这个目的也会帮助理解正则语法中的^和$符号。记住^和$也是来找 ‘子字符串‘的，只不过^$同时出现，恰巧表达了总体匹配表达式的含义，表达出了 ‘子字符串’是总体字符串的特例的状况。函数

理解^$同时出现的解释：某个子串，必须开头匹配表达式，并且结尾也必须匹配表达式，那么若是存在匹配的子串，它也只能是整个字符串。学习

2.表达式的每一个符号的语法仍是要清晰的掌握。随便看一眼，是懂非懂，无济于事。

2.1 [ ] ,表达的是单个字符。因此才能够[^xxx],来表示非某集合的单个符号。而 (||)，表达的选择其中的字符串。(^||)是没法表达非字符的意思的。由于这个语法没法肯定非以后，你须要字符的长度。它不会表达非的语法。而是表达开头匹配的意思。

要表达非子串，必须依赖预查功能，仔细想一想，(^||)，没法表达长度，并且语法也没有支持它表达任意长度。因此必须依赖否预查，

一段语法表示你要查的东西，附加一个预查功能，还有一个重点依然是第一要点。会有不少子串知足非子串的功能。

3.表达式默认的是贪婪模式，因此不少时候，咱们并无输入^$, 但结果是整个字符串，而不是子串。当咱们明确整个全匹配，最好加上^$，而不要依赖贪婪模式，这有助于咱们理解正则表达式的本意。

　　还有贪婪模式的方向是贪婪的包含，而不是贪婪的非包含，因此再表达非的时候，每每表达式和咱们想要表达的意思不一样。

以几个例子来分析正则表达式。

经常使用语法

1. . 表明一个任意字符。 * 号不是通配符，在正则中，它是表示无限重复前面的表达式。它自己单独是没有做用的。

2. [ ] 表示的是选择出一个单个字符。 ( ) 这个符号有不少组合，是最容易混淆的。 (| |) 表示选择 . ()表示子表达式，用于分组，或者让某些符号起做用如()*，让子表达式能够重复。 (?=) 又能够表示断言。

3. ^(?!.*apple).*$ 是否含有apple，含有返回位置0，不含有不返回数字。返回的数字，表示从那个位置开始进行下一个匹配。而咱们通常的表达式返回的是2个数字。表示这段区间是匹配的。从这段区间开始下一次表达式的匹配。

4. 断言语法又是个有个性的表达式。后断言，写在某子表达式的后面。前断言又须要写在表达式的前面。太戏精了。都有不一样的符号表达先后之分。为何不都放在表达式的后面呢？

一。表示一个不包含apple 的字符串，该如何写。

如字符串为 this is an apple! 咱们如何写一个表达式，让他不匹配 'this is an apple!'
1.(^apple)
这里^没有表示非的意思。^只能和[]单个字符来组合。这里的()表示了一个组，而不是选择符号。^表示的是要开头匹配表达式，也就是^符号的另一个语法含义。
我是如何知道的? 点这里。https://regex101.com/r/IDDARt/76 输入 (^apple) 这个表达式。它就会告诉你。这个网址是你掌握表达式的利器。
2.[^a][^p][^p][^l][^e]
这样呢？那我一个一个组合啊。聪明吗？毛线。仔细想一想[]表示的是一个字符。那么这里表示的是我要匹配5个字符，任意5个字符。只要1位置不是a，2位置不是p，3位置不是p,4l.5.e。若是只有1或2个或6个以上字符。是不会匹配的。
3.再认真想一想，咱们的需求：表示一个不包含apple 的字符串。‘不包含apple’ 这个是一个修饰，而不是要找的东西。是否是很眼熟，这个不就是预查的语法意义吗,?= ?! ?<= ?<!
3.1首先必须加上^$,由于不加的话是子串不包含apple，这个就太多匹配的了。不是咱们的本意，咱们要的是整个字符串不包含apple，而不是其中某子串不包含也能够。
3.2 那这样行不行？ ^.*(?!apple).*$ 。初看是能够，其实也不行。由于正则表达式是贪婪匹配，能够匹配不少。this is an apple!中，第一个 .* 能够匹配 this is an app .那那么后面只有le.也是符合表达式的。
3.3 想不出来，由于我是隐约记得有这个表达式，可是本身没去认真看，想本身推写出来。到这里卡壳了。
3.4... 往前预查，能够用.*来贪婪做弊。可是咱们能够用日后预查吧。已经获得的字符串，无法做弊吧。 ^.*(?<!apple)$ ，不行 ^.*(?<!apple).*$ 也不行。仔细思考。由于他不是准确表示了不包含的意思。
^.*(?<!apple)$ 这个能够准确表示结尾不能是apple,但不是包含， ^.*(?<!apple).*$ 这个就离谱了，解释器能够能够经过末尾的 .* ，对字符床进行任何的切割来使他不包含apple。如这里.*能够表示ple!。又是做弊。
3.5 惟一想到的是 ^.*(?<!apple.*)$ 。可是它不是个合法的表达式。看别人的写法吧。不想了。 ^((?!hede).)*$
3.6 ^((?!hede).)*$ ，某个字符的前面不包含hede，以后再对此类字符扩展。恩。没想到还能这样写。由于.*以后再描述它的限制，会让解释器利用.*来暴力匹配合适的状况。而 (?!hede). .让解释器只有一种解释。恩。不错。。。

3.7 本身作密码验证又发现一个更简单的写法。用空表达式的后查 ^(?!.*apple).*$ 。能够匹配是否包含apple。并从0位置。开始继续下面的匹配。

二，常见密码验证，必须包含大写字母，小写字母。长度9到16，并且只能是字母和数字。

^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])[0-9a-zA-Z]{9,16}$

1.本身真是不容易才推出来。涉及到的语法细节，不少文章都没有介绍。首先咱们的要求是必须包含。含有此意思的语法符号又是断言语法(?xxx).可是想一想，断言语法，是不包含断言语句的。也就是匹配以后是不包含数字，字母的。这个。。。

2.因此这里有个大部分文章没有讲的一个细节。若是 (?=) 以前，没有表达式的话，那么返回的不是匹配的子串，而是一个位置,position. (?=.*[0-9])，这个的意思是返回出现数字以前的位置，并且能够有任意符号。那么对于abc123456789A

会返回除下A以前的位置的全部位置。若是咱们加上^，那么把匹配缩到0位置。全部 ^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]) 这个会匹配含有小写，大写，数字的字符串的0位置。

我是如何没有了解相关介绍，而本身推出来的？

仍是咱们的利器。https://regex101.com/r/IDDARt/13 。本身写例子。本身看右边的解释，一点一点测试推测，求证。

3.加上^返回了咱们匹配的其实位置。那么这个时候才开始写匹配表达式。由于已经包含了大写，小写字母，数字。因此咱们的要求就变成了长度了。因此后面写[0-9a-zA-Z]{9,16}$。结束。

4.再总结下，前面没有表达式直接写(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]) 会返回一个位置，告诉你符合这些预判条件的初始位置在那里。由于咱们是要求初始位置必须是0.因此加上^,看看是否匹配，或者说去掉非0位置的其余匹配。

获得初始位置，就是咱们下面语句匹配的开始位置。咱们设定了为0，也就是字符开头。咱们只要长度和类型就能够。因此[0-9a-zA-Z]{9,16}，而且必须包含结尾。$

5. 受这里启发。我发现表示不包含有个更简洁的表示方法。 ^(?!.*apple).*$

3.省份证。

(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)

很简单了。不解释。

其实仔细看下正则表达式语法真的不多了。

正则表达式的所有语法字符。

元字符

元字符	描述
.	句号匹配任意单个字符除了换行符.
[ ]	字符种类. 匹配方括号内的任意字符.
[^ ]	否认的字符种类. 匹配除了方括号里的任意字符
*	匹配>=0个重复的在*号以前的字符.
+	匹配>=1个重复的+号前的字符.
?	标记?以前的字符为可选.
{n,m}	匹配num个大括号以前的字符 (n <= num <= m).
(xyz)	字符集, 匹配与 xyz 彻底相等的字符串.
\|	或运算符,匹配符号前或后的字符.
\	转义字符,用于匹配一些保留的字符 `[ ] ( ) { } . * + ? ^ $ \ \|`
^	从开始行开始匹配.
$	从末端开始匹配.

简写字符集

正则表达式提供一些经常使用的字符集简写. 以下:

简写	描述
.	除换行符外的全部字符
\w	匹配全部字母数字, 等同于 `[a-zA-Z0-9_]`
\W	匹配全部非字母数字, 即符号, 等同于: `[^\w]`
\d	匹配数字: `[0-9]`
\D	匹配非数字: `[^\d]`
\s	匹配全部空格字符, 等同于: `[\t\n\f\r\p{Z}]`
\S	匹配全部非空格字符: `[^\s]`
\f	匹配一个换页符
\n	匹配一个换行符
\r	匹配一个回车符
\t	匹配一个制表符
\v	匹配一个垂直制表符
\p	匹配 CR/LF (等同于 `\r\n`)，用来匹配 DOS 行终止符

零宽度断言，

说人话：匹配表达式的附加条件，

我要找小红旁边的（断言）男孩子。因此我要找的是男孩子，小红的不要（零宽度）。

符号	描述
?=	正先行断言-存在
?!	负先行断言-排除
?<=	正后发断言-存在
?<!	负后发断言-排除

后面应该有

后面不该该有

前面应该有

前面不该该有

其余语法规则

() ,表示分组，可用于后面来引用它，后向引用用于重复搜索前面某个分组匹配的文本。例如，\1表明分组1匹配的文本

\b(\w+)\b\s+\1\b能够用来匹配重复的单词，像go go, 或者kitty kitty。

下面列出了最经常使用的一些：

表4.经常使用分组语法
分类	代码/语法	说明
捕获	(exp)	匹配exp,并捕获文本到自动命名的组里
	(?<name>exp)	匹配exp,并捕获文本到名称为name的组里，也能够写成(?'name'exp)
	(?:exp)	匹配exp,不捕获匹配的文本，也不给此分组分配组号
零宽断言	(?=exp)	匹配exp前面的位置
	(?<=exp)	匹配exp后面的位置
	(?!exp)	匹配后面跟的不是exp的位置
	(?<!exp)	匹配前面不是exp的位置
注释	(?#comment)	这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读

最后还有平衡组/递归匹配

学习中途的理解

//思考一个表达式语法如何能够表示任何东西?首先必须有语法表示：
//某子段表达式出现0到无数次。只有掌握重复本身的技能，才有从有限到无限的可能。
//因此须要有1，表示子段的能力。2表示重复次数的能力。
//其次必须有1.表示某个符号的能力，2.表示任意符号的能力，3.表示某组符号中的一个的能力。那么这样的话，和前面的能力结合，理论上就能够表示任何东西。
//固然扩展开来，有一个非符号，在某些状况下，能够表达更简洁,特别注意非，首先是某个能够表示肯定含义的语法（肯定的长度和符号范围）才能去非。[]是肯定的语法，肯定了1长度。任意字符为范围。
//而对于匹配后的继续子匹配，能够在一次匹配中就表达出。须要扩展语法。java 用().
//其实 regex 晦涩就在于细节多，碎片学习的话，可能就会对于()的分组做用漏学。致使误认为是选择含义，产生各类疑惑。由于各类组合表示能够有多种语法表示，有的简洁，有的复杂。因此加大了看懂别人表达式的难度。
//[]是单个字符含义，()是选择和分组。{} 是表示重复概念。

1 . 校验密码强度

密码的强度必须是包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间。

^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

2. 校验中文

字符串仅能是中文。

^[\\u4e00-\\u9fa5]{0,}$

3. 由数字、26个英文字母或下划线组成的字符串

^\\w+$

4. 校验E-Mail 地址

同密码同样，下面是E-mail地址合规性的正则检查语句。

[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w-]*[\\w])?

5. 校验身份证号码

下面是身份证号码的正则校验。15 或 18位。

15位：
^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$
18位：
^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$

6. 校验日期

“yyyy-mm-dd“ 格式的日期校验，已考虑平闰年。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

7. 校验金额

金额校验，精确到2位小数。

^[0-9]+(.[0-9]{2})?$

8. 校验手机号

下面是国内 1三、1五、18开头的手机号正则表达式。（可根据目前国内收集号扩展前两位开头号码）

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$

9. 判断IE的版本

IE目前还没被彻底取代，不少页面仍是须要作版本兼容，下面是IE版本检查的表达式。

^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$

10. 校验IP-v4地址

IP4 正则语句。

\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b

11. 校验IP-v6地址

IP6 正则语句。

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

12. 检查URL的前缀

应用开发中不少时候须要区分请求是HTTPS仍是HTTP，经过下面的表达式能够取出一个url的前缀而后再逻辑判断。

if (!s.match(/^[a-zA-Z]+:\\/\\//))
{
    s = 'http://' + s;
}

13. 提取URL连接

下面的这个表达式能够筛选出一段文本中的URL。

^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?

14. 文件路径及扩展名校验

验证windows下文件路径和扩展名（下面的例子中为.txt文件）

^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$

15. 提取Color Hex Codes

有时须要抽取网页中的颜色代码，可使用下面的表达式。

^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$

16. 提取网页图片

倘若你想提取网页中全部图片信息，能够利用下面的表达式。

\\< *[img][^\\\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)

17. 提取页面超连接

提取html中的超连接。

(<a\\s*(?!.*\\brel=)[^>]*)(href="https?:\\/\\/)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^"]+)"((?!.*\\brel=)[^>]*)(?:[^>]*)>

18. 查找CSS属性

经过下面的表达式，能够搜索到相匹配的CSS属性。

^\\s*[a-zA-Z\\-]+\\s*[:]{1}\\s[a-zA-Z0-9\\s.#]+[;]{1}

19. 抽取注释

若是你须要移除HMTL中的注释，可使用以下的表达式。

<!--(.*?)-->

20. 匹配HTML标签

经过下面的表达式能够匹配出HTML中的标签属性。





<\\/?\\w+((\\s+\\w+(\\s*=\\s*(?:".*?"|'.*?'|[\\^'">\\s]+))?)+\\s*|\\s*)\\/?>

经常使用正则表达式

1、校验数字的表达式

数字：^[0-9]*$
n位的数字：^\d{n}$
至少n位的数字：^\d{n,}$
m-n位的数字：^\d{m,n}$
零和非零开头的数字：^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字：^([1-9][0-9]*)+(\.[0-9]{1,2})?$
带1-2位小数的正数或负数：^(\-)?\d+(\.\d{1,2})$
正数、负数、和小数：^(\-|\+)?\d+(\.\d+)?$
有两位小数的正实数：^[0-9]+(\.[0-9]{2})?$
有1~3位小数的正实数：^[0-9]+(\.[0-9]{1,3})?$
非零的正整数：^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
非零的负整数：^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
非负整数：^\d+$ 或 ^[1-9]\d*|0$
非正整数：^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
非负浮点数：^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
非正浮点数：^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
正浮点数：^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
负浮点数：^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮点数：^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

校验字符的表达式

汉字：^[\u4e00-\u9fa5]{0,}$
英文和数字：^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
长度为3-20的全部字符：^.{3,20}$
由26个英文字母组成的字符串：^[A-Za-z]+$
由26个大写英文字母组成的字符串：^[A-Z]+$
由26个小写英文字母组成的字符串：^[a-z]+$
由数字和26个英文字母组成的字符串：^[A-Za-z0-9]+$
由数字、26个英文字母或者下划线组成的字符串：^\w+$ 或 ^\w{3,20}$
中文、英文、数字包括下划线：^[\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号：^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
能够输入含有^%&',;=?$\"等字符：[^%&',;=?$\x22]+
禁止输入含有~的字符：[^~\x22]+

3、特殊需求表达式

Email地址：^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
域名：[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL：[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
手机号码：^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX)：^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
国内电话号码(0511-440522二、021-87888822)：\d{3}-\d{8}|\d{4}-\d{7}
电话号码正则表达式（支持手机号码，3-4位区号，7-8位直播号码，1－4位分机号）: ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
身份证号(15位、18位数字)，最后一位是校验位，可能为数字或字符X：(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
账号是否合法(字母开头，容许5-16字节，容许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头，长度在6~18之间，只能包含字母、数字和下划线)：^[a-zA-Z]\w{5,17}$
强密码(必须包含大小写字母和数字的组合，不能使用特殊字符，长度在 8-10 之间)：^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
强密码(必须包含大小写字母和数字的组合，可使用特殊字符，长度在8-10之间)：^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
日期格式：^\d{4}-\d{1,2}-\d{1,2}
一年的12个月(01～09和1～12)：^(0?[1-9]|1[0-2])$
一个月的31天(01～09和1～31)：^((0?[1-9])|((1|2)[0-9])|30|31)$
钱的输入格式：
1. 有四种钱的表示形式咱们能够接受:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000"：^[1-9][0-9]*$
2. 这表示任意一个不以0开头的数字,可是,这也意味着一个字符"0"不经过,因此咱们采用下面的形式：^(0|[1-9][0-9]*)$
3. 一个0或者一个不以0开头的数字.咱们还能够容许开头有一个负号：^(0|-?[1-9][0-9]*)$
4. 这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,由于钱总不能是负的吧。下面咱们要加的是说明可能的小数部分：^[0-9]+(.[0-9]+)?$
5. 必须说明的是,小数点后面至少应该有1位数,因此"10."是不经过的,可是 "10" 和 "10.2" 是经过的：^[0-9]+(.[0-9]{2})?$
6. 这样咱们规定小数点后面必须有两位,若是你认为太苛刻了,能够这样：^[0-9]+(.[0-9]{1,2})?$
7. 这样就容许用户只写一位小数.下面咱们该考虑数字中的逗号了,咱们能够这样：^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
8. 1到3个数字,后面跟着任意个逗号+3个数字,逗号成为可选,而不是必须：^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
9. 备注：这就是最终结果了,别忘了"+"能够用"*"替代若是你以为空字符串也能够接受的话(奇怪,为何?)最后,别忘了在用函数时去掉去掉那个反斜杠,通常的错误都在这里
xml文件：^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
中文字符的正则表达式：[\u4e00-\u9fa5]
双字节字符：[^\x00-\xff] (包括汉字在内，能够用来计算字符串的长度(一个双字节字符长度计2，ASCII字符计1))
空白行的正则表达式：\n\s*\r (能够用来删除空白行)
HTML标记的正则表达式：<(\S*?)[^>]*>.*?|<.*? /> ( 首尾空白字符的正则表达式：^\s*|\s*$或(^\s*)|(\s*$) (能够用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，很是有用的表达式)
腾讯QQ号：[1-9][0-9]{4,} (腾讯QQ号从10000开始)
中国邮政编码：[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
IP地址：((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))