scrapy爬取百度图片,解决ajax+json的异步问题

首先,我用爬虫的目的是为了学习图像处理,为制作自己的图像数据集,去训练分类器所用,所以这是一项基本技能吧,话不多说,下面就是我用scrapy框架去爬取百度图片的分类器 1.明确要爬取的对象是什么 (1)找到json文件 百度图片采用的是ajax+json机制,单独一次访问返回的html只是一个空壳,需要的图片信息并不在其中,真真的图片信息被打包放在json文件当中,所以我们真正要解读的是json文
相关文章
相关标签/搜索