当你成功安装BeautifulSoup 4库后,“from BeautifulSoup import BeautifulSoup”可能会遇到该错误。html
下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/python
下载完成后解压到python安装包的地方,存放在Beautifulsoup.**文件下ide
安装beautiful soup库函数
#安装 pip install beautifulsoup4 #检查 from bs4 import Beautiful Soup #安装 lxml pip install lxml
别的就很少说了工具
pip install beautifulsoup4
安装完成后ui
from bs4 import BeautifulSoup
进行导入模块,若是运行没有问题,那么咱们就是成功了--------若是是报的‘import name HTMLParseError’,就说明咱们的python版本与beautiful soup4的支持版本不符,那么我要更新运行beautiful soup,或者直接下载最新的(才脑袋痛哦)编码
pip3 install --upgrade beautifulsoup4
更新完成后,那么咱们就可使用 bs4 了,若是仍是报错 (那么我就进入他老巢————文件夹看看)打开 finder ,前往文件夹:spa
/usr/local/lib/python3.6/site-packages
在这个文件夹里找一找,看有没有两个beautifuls4的文件,若是有,删掉那个旧版本的,个人是不知道什么缘由,site-packages里多了个 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,删除掉就行了。命令行
beautifulsoup4安装完成以后,还须要一个叫 lxml 的依赖库:3d
pip3 install lxml
ok,完成,个人也就是到这里为止了,可能还有更好的操做方法也说不定的哈,小弟课多也就再花功夫在研究咯0.....0
Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,经过解析文档为用户提供须要抓取的数据,由于简单,因此不须要多少代码就能够写出一个完整的应用程序。
Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不须要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。而后,你仅仅须要说明一下原始编码方式就能够了。
Beautiful Soup已成为和lxml、html6lib同样出色的python解释器,为用户灵活地提供不一样的解析策略或强劲的速度
具体的介绍咱们仍是参考官方文档吧:
http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html