python爬虫匹配

时间 2021-01-21

原文原文链接

1.匹配分类我们在爬虫学习过程当中，大部分时候服务器返回给我们的是html，我们需要从HTML当中将数据过滤出来。所以我们需要学习字符串的匹配 1.1按照匹配内容进行描述正则匹配：内容的类型和内容的长度匹配 1.2按照匹配结构进行描述 Xpath lxml：结构特征匹配安装：pip install lxml 1.3综合性的匹配 Beautifulsoup：就是可以同时进行结构和内容的