python学习笔记(BeautifulSoup4)

BeautifulSoup4是一个从html或者xml中提取数据的py库。 lxml是局部遍历,BS是基于HTML DOM的,会载入整个文档,解析整个DOM树,时间和空间都会大很多。 #创建BS对象 soup = BeautifulSoup(html) #格式化打印出整个soup对象的内容 print ( soup.prettify()) 1.Tag 就是html中的一个个标签 tag有两个重要的
相关文章
相关标签/搜索