python爬虫之Phantomjs安装和使用

phantomjs:

  PhantomJS是一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操做,CSS选择器,JSON,Canvas 以及SVG。html

phantomjs:

  一、无UI界面的网站测试python

  二、屏幕快照web

  三、页面操做自动化chrome

 

官方文档:http://phantomjs.org/api/command-line.html编程

官方下载:http://phantomjs.org/downloadapi

一、下载完成后放到本身喜欢的一个位置,而后进入bin文件夹,而后把这个路径添加到环境变量里面。浏览器

 

 使用:缓存

 学习过Selenium的同窗都知道webdriver.chrome(),使用谷歌浏览器打开爬取页面(或者是测试页面),若是是.PhantomJS()的话就直接省去了系统打开页面的步骤。学习

browser = webdriver.Chrome()
browser = webdriver.PhantomJS(service_args=SERVICE_ARGS)

 service_args= 这里写的是参数,参数以下:测试

  一、不加载图片

  二、启用硬盘缓存

SERVICE_ARGS = ['--load-images=false','--disk-cache=true']
相关文章
相关标签/搜索