CrawlSpider全网爬虫

时间 2020-07-17

原文原文链接

CrawlSpider全网爬虫 CrawlSpider是继承了Spider的全站爬虫类。CrawlSpider类定义了一些规则(rule)来提供跟进提取出来的网址link的方便的机制，更适合从爬取的网页中获取新的link并继续爬取的工做。python 产生一个crawlspider scrapy genspider -t crawl 爬虫名 LinkExtractors(连接提取器) 在响应中能够