Python学习笔记-网络爬虫（二、提取）

时间 2020-12-30

原文原文链接

一、Beautiful Soup 1、BeautifulSoup库基本元素 2、基于bs4库的HTML内容遍历方法 3、基于bs4的HTML格式化和编码（让HTML信息可读性更好）二、信息组织与提取方法 1、信息标记的三种形式 2、三种信息标记形式的比较 3、信息提取的一般方法 4、基于bs4的HTML内容查找方法 find_all() find_all()第一个参数：name （re

>>阅读原文<<