基于PHP/CURL/codeIgniter的Spider Webbot爬虫[2]-使用LIB_parse函数抓取关键信息

时间 2019-12-05

标签基于 php curl codeigniter spider webbot 爬虫使用 lib parse 函数抓取关键信息栏目 PHP 繁體版

原文原文链接

=====================================================html

parse_array相似于return_between 返回的是数组格式
parse_array(string unparsed，string beg，string end)
其中，unparsed是须要被解释的字符串，这里使用http_get()得到$target中的网站首页做为目标
beg是开始的字符，这里抓取做为开始数组

由于meta标签的属性是
这样作就获得一个网站的全部meta关键字属性服务器

htmlspecialchars能够把抓取的<title>之类的标签转化成字符串，不让服务器进行解释
插入到输出的先后，能够阻止服务器解释HTML网站