Python网络爬虫：利用正则表达式方法爬取‘’豆瓣读书‘’中‘’新书速递‘’条目

时间 2020-05-09

标签 python 网络爬虫利用正则表达式方法豆瓣读书新书速递条目栏目 Python 繁體版

原文原文链接

1.简述：正则表达式是爬虫的方法之一，这里利用Requests库进行爬取，尽管Urllib也能进行爬取，但过程过于繁琐，在了解Urllib的爬取过程后，没有进行实战演练，但在学习了Requests的爬取后，进行了实战学习，由于考虑到确实以后会多用到Requests包，因此这一步仍是要好好掌握学习一下的：)另外，还用到re包，主要在利用正则表达式进行爬虫是时用到匹配(re.match)、查找(re.

>>阅读原文<<