新华书店书本信息定向爬虫

时间 2021-01-14

原文原文链接

在学习了半个月python基础知识以及相关的爬虫基础技术后，尝试学以致用，本次决定使用requests、BeautifulSoup来对新华书店（https://www.xhsd.com）小说类书本商品信息进行爬取。 1. 爬虫的构建思路进行分析: 将代码分为4块；第一块构建函数getHTMLText(），该函数的作用是通过requests来获取到页面的信息；第二块构建fillList()，该函