Scrapy之dupefilters(去重)以及源码分析/depth

  避免重复访问   scrapy默认使用 scrapy.dupefilter.RFPDupeFilter 进行去重,相关配置有:  1 DUPEFILTER_CLASS = 'scrapy.dupefilter.RFPDupeFilter' 2 DUPEFILTER_DEBUG = False 3 JOBDIR = "保存记录的日志路径,如:/root/" # 最终路径为 /root/requ
相关文章
相关标签/搜索