正则表达式学习笔记2

1.前言

以前的一篇文章主要是对正则表达式的基础知识的记录,不过实践方能出真知,接下来主要要结合具体的例子进行学习的。正则表达式

2.具体实践

(注:在正则表达式中 "/" 是在某些语言中做为开始和结束定界符的标志存在的)json

(1) 手机号检验:

正则表达式:/^1[3456789]\d{9}$/
详解:
  • "^1" 表明从字符串开始的位置进行匹配的,开头必须是"1";
  • "[3456789]"表明规定第二位要从这里面选择;
  • "\d{9}$" 表明剩下的9位纯数字
运行代码:
$regex = '/^1[3456789]\d{9}$/';
$mobileList = array(
   '15168901234',
   '123456',
   '12345678901',
   '25168901234',
);
foreach ($mobileList as $mobile) {
   if (preg_match($regex, $mobile)) {
       echo $mobile . "| 是正确的手机号\n";
   } else {
       echo $mobile . "| 不是手机号\n";
   }
}
复制代码
运行结果:
15168901234| 是正确的手机号
123456| 不是手机号
12345678901| 不是手机号
25168901234| 不是手机号
复制代码

(2)提取cookies

正则表达式:'/(?<=user=)"?[|\d:=a-zA-Z]{1,}/'
详解:
  • '(?<=user=)'使用的是反向确定预查,从'user='处开始匹配查找字符串(注:预查表示非获取匹配,匹配内容不会使用)
  • '"?' 表示有子表达式'"'零次或者一次
  • '[|\d:=a-zA-Z]{1,}' 以后内容包含'|'、':'、数字、大小写字符至少一次
运行代码
$header = 'HTTP/1.1 200 OK Date: Wed, 23 May 2018 01:42:48 GMT Content-Type: application/json; charset=utf-8 Content-Length: 57 Connection: keep-alive Set-Cookie: user="2|1:0|10:157XXXXX368|4:user|16:MDXXXXXg0MzY5|f80558eXXXXXXXXXX94b3a";';

$regex = '/(?<=user=)\"?[\|\d\:\=a-zA-Z]{1,}/';

preg_match($regex, $header, $matches);

var_dump(trim($matches[0], "\""));

复制代码
运行结果

2|1:0|10:157XXXXX368|4:user|16:MDXXXXXg0MzY5|f80558eXXXXXXXXXX94b3abash

(3)获取url信息

正则表达式:'/^(\w+)://([^/:]+)(:\d*)?([^ ]*)/$'
详解:
  • '(\w+)' 第一部分由多个字母、数字、下划线构成
  • '://' 第一部分与第二部分分隔为'://'
  • '([^/:]+)' 第二部分使用的是负值字符范围,除了'/'、':'外均可以匹配
  • '(:\d*)?' 第三部分为':'开始,数字重复零次或者屡次,第三部分总体重复零次或者一次
  • '([^ ]*)' 第四部分使用的是负值字符范围,除了空格全部均可以匹配
运行代码
$regex = '/^(\w+):\/\/([^\/:]+)(:\d*)?([^# ]*)/';
$url = "https://juejin.im/user/59bf3ba9518825231f64bd05/posts";
preg_match($regex, $url, $matches);
var_dump($matches);
复制代码
运行结果
array(5) {
  [0]=>
  string(53) "https://juejin.im/user/59bf3ba9518825231f64bd05/posts"
  [1]=>
  string(5) "https"
  [2]=>
  string(9) "juejin.im"
  [3]=>
  string(0) ""
  [4]=>
  string(36) "/user/59bf3ba9518825231f64bd05/posts"
}
复制代码

(4)提取标签

正则表达式:'/^<(\w+)\s*/?>\w*(?:</\1>|)$/'
详解:
  • '<(\w+)\s*/?>' 第一部分由<+多个字母、数字、下划线+'/'(0或1次)+>构成
  • '\w*' 第二部分隔为标签中间内容
  • '(?:</\1>|)' 第三部分'(?:)'为非获取匹配模式,'<'+'/'+第一个小括号的值+'>'或者空
运行代码
$regex = '/^<(\w+)\s*\/?>\w*(?:<\/\1>|)$/';
$string = "<span></span>";
preg_match($regex, $string, $matches);
var_dump($matches);
复制代码
运行结果
array(2) {
  [0]=>
  string(14) "<span/></span>"
  [1]=>
  string(4) "span"
}
复制代码

亮点是 "\1" 获取第一个小括号里面的匹配值,第一次看到这种用法,学习了!cookie

3.我的感觉

在开发过程当中遇到须要正则表达式的时候,通常会选择上网查找相似的,而后就开始逐步进行调试直到符合预期要求,虽然最终也能够解决问题,可是每每会耗费大量时间。因而下定决心要搞懂正则表达式,因此就有两篇记录学习过程的笔记。 通过学习虽不能说之后直接能够写出要用的表达式,可是能够大幅下降调试的时间。app

相关文章
相关标签/搜索