由于以前对于POSIX类的正则表达式使用的比较少,也就没有上心去记忆,最近由于使用的比较多,就仔细的看了一下作了一个简单的总结。git
\p{Lower} 小写字母字符:[a-z]正则表达式
\p{Upper} 大写字母字符:[A-Z]学习
\p{ASCII} 全部 ASCII:[\x00-\x7F]blog
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]文档
\p{Digit} 十进制数字:[0-9]it
\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]io
\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[]^_`{|}~程序
\p{Graph} 可见字符:[\p{Alnum}\p{Punct}]im
\p{Print} 可打印字符:[\p{Graph}\x20]总结
\p{Blank} 空格或制表符:[\x20\t]
\p{Cntrl} 控制字符:[\x00-\x1F\x7F]
\p{XDigit} 十六进制数字:[0-9a-fA-F]
\p{Space} 空白字符:[ \t\n\v\f\r]
由于以前没有仔细看,都是用的时候在查一下,致使了老是记不住,因此学东西的时候仍是得第一次学习的时候就多花点心思。
如上图所示,其实很是简单,就是匹配字符、数字、标点符号、控制字符和空白字符。
Alpha是希腊字符的第一个字符,通常咱们看到这个在程序或者程序文档中出现基本有统一的语义,就是表示字母,包括大写字母和小写字母。
Digit就是字面意义,表示数字,就阿拉伯数字0到9。
Alnum能够看作是Alpha和number的组合,就是Alpha和Digit的组合,就是大小写字母和数字[0-9a-zA-Z]。
Punct是Punctuation的缩写,就是表示标点符号,就是ASCII码在[33-47]和[58-64]这2个区域,中间是Digit。
Blank,只包含2个字符,空格,ASCII码32,和制表符\t,ASCII码9。
Cntrl表示控制字符,ASCII在0到31,在加上ASCII的最后一个127的DEL,制表符也是控制字符。
XDigit是表示十六进制字符,很是简单。
Space就是ASCII在9-13这5个字符,它们分别是制表符\t,换行符\n,垂直制表符\v,换页\f,回车\r。