scrapy爬取百度图片，解决ajax+json的异步问题

时间 2021-01-05

标签 scrapy ajax python 网络爬虫百度图片栏目 Python 繁體版

原文原文链接

首先，我用爬虫的目的是为了学习图像处理，为制作自己的图像数据集，去训练分类器所用，所以这是一项基本技能吧，话不多说，下面就是我用scrapy框架去爬取百度图片的分类器 1.明确要爬取的对象是什么（1）找到json文件百度图片采用的是ajax+json机制，单独一次访问返回的html只是一个空壳，需要的图片信息并不在其中，真真的图片信息被打包放在json文件当中，所以我们真正要解读的是json文

>>阅读原文<<