当当网书籍数据爬进数据库

时间 2021-01-05

原文原文链接

当当网书籍数据爬进数据库首先我们要考虑到当当网有没有反爬机制，几次后发现是没有的。一开始我们要考虑我们要爬取的信息是哪些，然后在items.py下面全部写出来。然后就写爬虫文件从核心文件开始定位导入items里面的类。（一定不要导入错了）对应的爬取地址写好就用yield返回。然后肯定不想只爬取一页的书籍吧，那就一定要加循环了。仔细观察后发现又100页。所以循环如下：在我们写pipel

>>阅读原文<<