安装beautifulsoup库时遇到麻烦

1、Beautiful Soup库遇到的问题

       1.ImportError: No module named BeautifulSoup       

当你成功安装BeautifulSoup 4库后,“from BeautifulSoup import BeautifulSoup”可能会遇到该错误。html


        其中的缘由是BeautifulSoup 4库更名为bs4,须要使用“from bs4 import BeautifulSoup”导入。

        2.TypeError: an integer is required

        当你使用“print soup.title.string”获取title的值时,可能会遇到该错误。以下:

        它应该是IDLE的BUG,当使用命令行Command没有任何错误。参考: stackoverflow。同时能够经过下面的代码解决该问题:
        print unicode(soup.title.string)
        print str(soup.title.string)

下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/python

下载完成后解压到python安装包的地方,存放在Beautifulsoup.**文件下ide

 

win+R  ————cmd  cd (第 2 步放置安装包的位置)C:\Python36\beautifulsoup4-4.6.0

安装:python steup.py install

二. 安装及介绍Beautiful Soup库

安装beautiful soup库函数

#安装
pip install beautifulsoup4
#检查
from bs4 import Beautiful Soup
#安装 lxml
pip install lxml
捷径

别的就很少说了工具

pip install beautifulsoup4

安装完成后ui

from bs4 import BeautifulSoup

进行导入模块,若是运行没有问题,那么咱们就是成功了--------若是是报的‘import name HTMLParseError’,就说明咱们的python版本与beautiful soup4的支持版本不符,那么我要更新运行beautiful soup,或者直接下载最新的(才脑袋痛哦)编码

pip3 install --upgrade beautifulsoup4

更新完成后,那么咱们就可使用 bs4 了,若是仍是报错 (那么我就进入他老巢————文件夹看看)打开 finder ,前往文件夹:spa

/usr/local/lib/python3.6/site-packages

在这个文件夹里找一找,看有没有两个beautifuls4的文件,若是有,删掉那个旧版本的,个人是不知道什么缘由,site-packages里多了个 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,删除掉就行了。命令行

beautifulsoup4安装完成以后,还须要一个叫 lxml 的依赖库:3d

pip3 install lxml

ok,完成,个人也就是到这里为止了,可能还有更好的操做方法也说不定的哈,小弟课多也就再花功夫在研究咯0.....0

Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,经过解析文档为用户提供须要抓取的数据,由于简单,因此不须要多少代码就能够写出一个完整的应用程序。

Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不须要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。而后,你仅仅须要说明一下原始编码方式就能够了。

Beautiful Soup已成为和lxml、html6lib同样出色的python解释器,为用户灵活地提供不一样的解析策略或强劲的速度

具体的介绍咱们仍是参考官方文档吧:
 http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

相关文章
相关标签/搜索