python-64:无痛的入门BS4

好了,如今开始来认真的学习BS4,我以为学习应该是快乐的一件事情,尤为是在你学习一个新知识的时候,我不喜欢那些专业性很强的文档或者教程,里面的名词我看都看不懂,怎么去学习这门知识,因此,我但愿能来一个简单的,快速的,无痛的入门html

既然说是简单的入门,因此我只打算讲两个问题,如何使用BS4和怎么使用咱们的文档工具

  1. 如何使用BS4,首先先来看看官方文档上的说明
    学习

将一段文档传入BeautifulSoup 的构造方法,就能获得一个文档的对象, 能够传入一段字符串或一个文件句柄.code

from bs4 import BeautifulSoup
soup = BeautifulSoup(open("index.html"))
soup = BeautifulSoup("<html>data</html>")

这几句话很重要,它是将一段文字或者什么东西转换为BeautifulSoup的一个实例,有了这个实例,咱们才能进行后续的各类操做,那咱们如今就来详细的看一看这几句话吧htm

1.要使用BS4,首先固然是引入这个模块,下面的这句话就是将模块引入的操做对象

from bs4 import BeautifulSoup

2. 后面两句的功能实际上是同样的,都是传入一个文档或者是文字,而后获得一个BeautifulSoup的实例,官方文档里也说明了,能够传入一段字符串或一个文件句柄教程

soup = BeautifulSoup(open("index.html")) # 传入一个句柄
soup = BeautifulSoup("<html>data</html>") # 传入一段字符串

其实BS4的使用就是简单的两句话,引入模块,而后构造对象的实例,只要稍微记一下就能够了,这就已经入门了,有了这个,咱们就可使用BS4的全部特性去完成你想要实现的功能,那么,怎么知道有哪些特性以及该怎么去使用这些特性呢?文档

看文档,全部可使用的方法以及怎么使用的例子均可以在文档找获得,因此,接下来的关键就是有一份好文档以及正确使用文档
字符串

2.如何使用文档入门

关于如何使用文档,实际上是仁者见仁智者见智的,能够从头至尾将整个文档看完或者也能够吧文档当成一个工具箱,须要实现什么功能再去文档里面寻找,我后面的内容会使用第二种方法,由于我实在是懒得看这些无趣的文档
相关文章
相关标签/搜索