讲起动态网页获取咱们必定会用到selenium,至于selenium在各类语言的开发代码不少,可是在咱们兴致勃勃找了不少代码,要运行的时候,编译器只会给咱们抛出异常,由于咱们没有配置好环境。下面我将为你们介绍我在配置selenium环境的作法。php
首先咱们从Chrome浏览器的配置提及:html
Chrome浏览器的根据其版本分为不少中,当咱们点开Chromediver download 页就懵逼了,这么多驱动咱们应该下载那个呢,chromedriver对应的Chrome版本能够查看到你的chrome应该下载那个驱动。python
谷歌浏览器下载地址:git
使用mac本的可使用:chrome-to-mac in uptodowngithub
chromedriver下载地址: http://chromedriver.storage.googleapis.com/index.htmlweb
在解决了驱动的问题以后,那咱们应该把驱动放在那个位置,才能让咱们的程序直接调用chromedriver呢。chromedriver放在python的根路径下,python也能够直接调用驱动。若是你已经配置好了,那咱们就来运行下面的代码,获取python官方网站的源码把:chrome
1 # encoding:utf-8 2 # Author:"richie" 3 # Date:8/16/2017 4 5 from selenium import webdriver 6 url='https://www.python.org/' 7 driver = webdriver.Firefox() 8 driver.get(url) 9 driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") 10 html_source = driver.page_source 11 driver.quit() 12 print(html_source)
固然你也能够放放置在其余地方,把路径加进来就行了,好比放在C盘的根路径:api
1 # encoding:utf-8 2 # Author:"richie" 3 # Date:8/16/2017 4 5 from selenium import webdriver 6 url='https://www.python.org/' 7 #引入chromedriver.exe 8 chromedriver = "C:\chromedriver.exe" 9 driver = webdriver.Chrome(chromedriver) 10 driver.get(url) 11 driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") 12 html_source = driver.page_source 13 driver.quit() 14 print(html_source)
firefox的配置没有chrome那么麻烦,可是FireFox打开速度相对要慢一丢丢,驱动下载连接Firefox的驱动geckodriver 下载地址:https://github.com/mozilla/geckodriver/releases/浏览器
配置方法和chrome同样,火狐各个版本下载地址。网站
1 from selenium import webdriver 2 3 browser = webdriver.Firefox() 4 browser.get('http://www.baidu.com/')
IE的驱动IEdriver 下载地址:http://www.nuget.org/packages/Selenium.WebDriver.IEDriver/
from selenium import webdriver browser = webdriver.Ie() browser.get('http://www.baidu.com/')
补充:
全部版本selenium以及IEDriverServer下载
固然还有selenium和IEDriverServer,Python版的selenium直接pip就能够了,下面的连接里主要是Java版的和.NET版的