scrapy爬虫框架---CrawlSpider类

时间 2021-01-12

原文原文链接

（1）、简介在糗事百科爬虫中我们的爬虫是继承scrapy.Spider类的，这也是基本的scrapy框架爬虫，在这个爬虫中我们自己在解析完整个页面后再获取下一页的url,然后重新发送了一个请求，而使用CrawlsSpider类可以帮助我们对url提出条件，只要满足这个条件，都进行爬取，CrawlSpider类继承自Spider，它比之前的Spider增加了新功能，即可以定义url的爬取规则，而不