基于PHP/CURL/codeIgniter的Spider Webbot爬虫[6]-PHP关于正则表达式的函数preg

preg_replace(pattern,replacement,subject)数组

pattern模式,其实就是要查找的字段。不能是数字,字母。若是是数字和字母的话,要用/string/来表示
replacement替换字段 要替换上的string,能够是任意
subject操做目标,这里能够是一段string,也能够使一个变量,或者一个http_get()。字符串

preg_match(pattern,subject)这个只返回bool真假
preg_match_all(pattern,subject,result_array)这个在返回bool真假的同时,还会返回一个二维数组,里面有类似的字符,还有把这个string做为一个数组元素
preg_split(pattern,subject)
若是在subject中找到了pattern,就在该处进行切割,而且不保留pattern
//返回result_array[0]=前半段,result_array[1]=后半段get

$subject_string="there are 129 stories about Tim and another 3129 about Tom";
/这是要匹配的内容/ 这是pattern
$subject_string //这是target字符串string

preg_match_all("/\d/",$subject_string,$matches_array);it

$matches_array=Array([0]=>1 [1]=>2 [2]=>9)

\跳脱符变量

匹配数字
\d能够表示单独一个数字,这样一个下标表明一个数字
\d\d\d 能够表明3个数字,而且一个下标表明三个数字
\d+表示取一整块数字,直到最后一位不是数字im

匹配字母
\D匹配一个字母,
\D\D\D匹配3个字母,可是,若是不加上\b进行边界定位,就会匹配全部含有三个字母的状况
好比Tom,Tom,There之中的the,也会被抓取二维数组

/\b\D\D\D\b/这样能够正确匹配3个字母,等价于/\b\D{3}\b/字符

万用字元数字

相关文章
相关标签/搜索