python学习笔记（BeautifulSoup4）

时间 2020-12-27

原文原文链接

BeautifulSoup4是一个从html或者xml中提取数据的py库。 lxml是局部遍历，BS是基于HTML DOM的，会载入整个文档，解析整个DOM树，时间和空间都会大很多。 #创建BS对象 soup = BeautifulSoup(html) #格式化打印出整个soup对象的内容 print ( soup.prettify()) 1.Tag 就是html中的一个个标签 tag有两个重要的