python BeautifulSoup 介绍--安装

Python中,专门用于HTML/XML解析的库;html

特色是:python

即便是有bug,有问题的html代码,也能够解析。bash

BeautifulSoup主要有两个版本spa

BeautifulSoup 3

以前的,比较早的,是3.x的版本。code

BeautifulSoup 3的在线文档

最新的,可用的,在线文档是:htm

http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html文档

中文版的是:get

http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlit

下载BeautifulSoup 3

http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/io

中能够下载到不少版本,好比我经常使用的3.0.6的版本:

BeautifulSoup-3.0.6.py

http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py

BeautifulSoup 4:缩写为bs4

最新的v4版本的BeautifulSoup,更名为bs4了。

注意:

使用bs4时,导入BeautifulSoup的写法是:

from  bs4  import  BeautifulSoup
 

bs4的在线文档

http://www.crummy.com/software/BeautifulSoup/bs4/doc/

 

下载bs4

http://www.crummy.com/software/BeautifulSoup/bs4/download/

能够下载到对应的bs4的版本,好比:

此时最新的版本是:

beautifulsoup4-4.1.3.tar.gz

http://www.crummy.com/software/BeautifulSoup/bs4/download/beautifulsoup4-4.1.3.tar.gz

BeautifulSoup的用法

如何安装BeautifulSoup

3.0.6以前:无需安装,放到和Python文件同目录下便可使用

3.0.6以前,都是不须要安装的,因此使用起来最简单,直接下载对应的版本,好比:

http://www.crummy.com/software/BeautifulSoup/bs3/download//3.x/BeautifulSoup-3.0.6.py

获得了BeautifulSoup-3.0.6.py,而后更名为:BeautifulSoup.py

而后,放到和你当前的python文件同目录下,好比我当前python文件是:

D:\tmp\tmp_dev_root\python\beautifulsoup_demo\beautifulsoup_demo.py

那就放到

D:\tmp\tmp_dev_root\python\beautifulsoup_demo\

下面,和beautifulsoup_demo.py同目录。

 

3.0.6以后:须要安装BeautifulSoup后才可以使用

关于如何安装一个Python的第三方模块,简单说就是,进入对应目录,运行:

setup.py  install

详细解释可参考:

【总结】Python安装第三方的库、package的方法

相关文章
相关标签/搜索