什么是user agent
User Agent中文名为用户代理,简称 UA,它是一个特殊字符串头,使得服务器可以识别客户使用的操做系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。
网站能够经过判断不一样UA来呈现不一样的网站,例如手机访问和PC访问显示不一样的页面。
PHP在用file_get_contents函数采集网站时,有时会明明用浏览器能够看,但就是采不到任何内容。
这颇有多是服务器上作了设置,根据 User_agent判断是否为正常的浏览器请求,由于默认PHP的file_get_contents函数是不发送ua的。
若是要采集这样的网站,咱们就必需要让PHP模拟浏览器发送UA,欺骗网站返回正常内容。浏览器
实现以下:
服务器
ini_set('user_agent', 'Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 4 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 Mobile Safari/535.19');
这里 我模拟的是谷歌浏览器.函数