Day-3页面分析（Xpath）

时间 2021-01-22

原文原文链接

一、爬取分析爬虫是非常考验随机性的，运气性，以及思维跳跃的在此次项目中，首先我们找到京东图书的页面，进入到里边京东所有图书的API接口是： http:/book.jd.com/booksort.html （建议自己去京东网站自己找一下）对于每一本书来说，它都会有大分类，小分类思考： 1.分类的爬取 2.翻页 ---> nextwork（谷歌检查) 3.循环遍历的终点 4.如何判断当前