Python中,专门用于HTML/XML解析的库;html
特色是:python
即便是有bug,有问题的html代码,也能够解析。bash
BeautifulSoup主要有两个版本spa
以前的,比较早的,是3.x的版本。code
最新的,可用的,在线文档是:htm
http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html文档
中文版的是:get
http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlit
http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/io
中能够下载到不少版本,好比我经常使用的3.0.6的版本:
http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py
最新的v4版本的BeautifulSoup,更名为bs4了。
注意:
使用bs4时,导入BeautifulSoup的写法是:
from
bs4
import
BeautifulSoup
http://www.crummy.com/software/BeautifulSoup/bs4/doc/
http://www.crummy.com/software/BeautifulSoup/bs4/download/
能够下载到对应的bs4的版本,好比:
此时最新的版本是:
http://www.crummy.com/software/BeautifulSoup/bs4/download/beautifulsoup4-4.1.3.tar.gz
3.0.6以前,都是不须要安装的,因此使用起来最简单,直接下载对应的版本,好比:
http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py
获得了BeautifulSoup-3.0.6.py,而后更名为:BeautifulSoup.py
而后,放到和你当前的python文件同目录下,好比我当前python文件是:
D:\tmp\tmp_dev_root\python\beautifulsoup_demo\beautifulsoup_demo.py
那就放到
D:\tmp\tmp_dev_root\python\beautifulsoup_demo\
下面,和beautifulsoup_demo.py同目录。
关于如何安装一个Python的第三方模块,简单说就是,进入对应目录,运行:
setup.py
install
详细解释可参考: