requests+正则表达式爬取豆瓣读书top250

时间 2020-02-17

原文原文链接

经过rquests库请求获得豆瓣top250网页源代码，并经过正则表达式匹配获得对应信息-书名，做者信息，评分以及简介。网站的URL为’https://book.douban.com/top250?start=0’,但咱们拉到底部发现250本读书的信息被分红了10页，这就须要咱们首先对URL的规律进行分析获得全部页面的URL信息传递给get（）方法中请求源代码。点击到第2页发现URL为’htt

>>阅读原文<<