scrapy 爬虫踩过的坑（I）

时间 2021-01-11

原文原文链接

问题1：正则表达式没问题，但是爬虫进不了item方法分析：　　1. 可能是下载不到list 页面的内容。可以用 scrapy shell url 进行测试　　　　2. 可能是allowed_domains 不允许　　　　3. list 页面里的链接不符合正则表达式或者说list 页面里根本就没有相关的链接解决方案针对第一种：有可能是所爬取的网站有反爬虫机制，比如禁掉你的ip