新华书店书本信息定向爬虫

在学习了半个月python基础知识以及相关的爬虫基础技术后,尝试学以致用,本次决定使用requests、BeautifulSoup来对新华书店(https://www.xhsd.com)小说类书本商品信息进行爬取。 1. 爬虫的构建思路进行分析: 将代码分为4块; 第一块构建函数getHTMLText(),该函数的作用是通过requests来获取到页面的信息; 第二块构建fillList(),该函
相关文章
相关标签/搜索