好了,如今开始来认真的学习BS4,我以为学习应该是快乐的一件事情,尤为是在你学习一个新知识的时候,我不喜欢那些专业性很强的文档或者教程,里面的名词我看都看不懂,怎么去学习这门知识,因此,我但愿能来一个简单的,快速的,无痛的入门html
既然说是简单的入门,因此我只打算讲两个问题,如何使用BS4和怎么使用咱们的文档工具
如何使用BS4,首先先来看看官方文档上的说明
学习
将一段文档传入BeautifulSoup 的构造方法,就能获得一个文档的对象, 能够传入一段字符串或一个文件句柄.code
from bs4 import BeautifulSoup soup = BeautifulSoup(open("index.html")) soup = BeautifulSoup("<html>data</html>")
这几句话很重要,它是将一段文字或者什么东西转换为BeautifulSoup的一个实例,有了这个实例,咱们才能进行后续的各类操做,那咱们如今就来详细的看一看这几句话吧htm
1.要使用BS4,首先固然是引入这个模块,下面的这句话就是将模块引入的操做对象
from bs4 import BeautifulSoup
2. 后面两句的功能实际上是同样的,都是传入一个文档或者是文字,而后获得一个BeautifulSoup的实例,官方文档里也说明了,能够传入一段字符串或一个文件句柄教程
soup = BeautifulSoup(open("index.html")) # 传入一个句柄 soup = BeautifulSoup("<html>data</html>") # 传入一段字符串
其实BS4的使用就是简单的两句话,引入模块,而后构造对象的实例,只要稍微记一下就能够了,这就已经入门了,有了这个,咱们就可使用BS4的全部特性去完成你想要实现的功能,那么,怎么知道有哪些特性以及该怎么去使用这些特性呢?文档
看文档,全部可使用的方法以及怎么使用的例子均可以在文档找获得,因此,接下来的关键就是有一份好文档以及正确使用文档
字符串
2.如何使用文档入门
关于如何使用文档,实际上是仁者见仁智者见智的,能够从头至尾将整个文档看完或者也能够吧文档当成一个工具箱,须要实现什么功能再去文档里面寻找,我后面的内容会使用第二种方法,由于我实在是懒得看这些无趣的文档