python爬虫匹配

1.匹配分类 我们在爬虫学习过程当中,大部分时候服务器返回给我们的是html,我们需要从HTML当中将数据过滤出来。所以我们需要学习字符串的匹配 1.1按照匹配内容进行描述 正则匹配:内容的类型和内容的长度匹配   1.2按照匹配结构进行描述 Xpath lxml:结构特征匹配 安装:pip install lxml   1.3综合性的匹配 Beautifulsoup:就是可以同时进行结构和内容的
相关文章
相关标签/搜索