PhantomJS是一个无界面的、可脚本编程的WebKit浏览器引擎,它原生支持多种Web标准:DOM操做、CSS选择器、JSON、Canvas以及SVG。html
Selenium支持PhantomJS,这样在运行的时候就不会再弹出一个浏览器了。并且PhantomJS的运行效率也很高,还支持各类参数配置,使用很是方便。下面咱们就来了解一下PhantomJS的安装过程。web
咱们须要在官方网站下载对应的安装包,PhantomJS支持多种操做系统,好比Windows、Linux、Mac、FreeBSD等,咱们能够选择对应的平台并将安装包下载下来。编程
下载完成后,将PhantomJS可执行文件所在的路径配置到环境变量里。好比在Windows下,将下载的文件解压以后并打开,会看到一个bin文件夹,里面包括一个可执行文件phantomjs.exe,咱们须要将它直接放在配置好环境变量的路径下或者将它所在的路径配置到环境变量里。好比,咱们既能够将它直接复制到Python的Scripts文件夹,也能够将它所在的bin目录加入到环境变量。api
Windows下环境变量的配置能够参见1.1节,Linux及Mac环境变量的配置能够参见1.2.3节,在此再也不赘述,关键在于将PhantomJS的可执行文件所在路径配置到环境变量里。浏览器
配置成功后,能够在命令行下测试一下,输入:测试
phantomjs
若是能够进入到PhantomJS的命令行,那就证实配置完成了,如图1所示。网站
图1控制台ui
在Selenium中使用的话,咱们只须要将Chrome切换为PhantomJS便可:url
from selenium import webdriver browser = webdriver.PhantomJS() browser.get('https://www.baidu.com') print(browser.current_url)
运行以后,咱们就不会发现有浏览器弹出了,但实际上PhantomJS已经运行起来了。这里咱们访问了百度,而后将当前的URL打印出来。spa
控制台的输出以下:
https://www.baidu.com/
如此一来,咱们便完成了PhantomJS的配置,后面能够利用它来完成一些页面的抓取。
这里咱们介绍了Selenium对应的三大主流浏览器的对接方式,后面咱们会对Selenium及各个浏览器的对接方法进行更加深刻的探究。