requests+正则表达式爬取豆瓣读书top250

经过rquests库请求获得豆瓣top250网页源代码,并经过正则表达式匹配获得对应信息-书名,做者信息,评分以及简介。 网站的URL为’https://book.douban.com/top250?start=0’,但咱们拉到底部发现250本读书的信息被分红了10页,这就须要咱们首先对URL的规律进行分析获得全部页面的URL信息传递给get()方法中请求源代码。 点击到第2页发现URL为’htt
相关文章
相关标签/搜索