scrapy 爬取知乎用户信息

先从知乎的轮子哥开始爬去他的粉丝列表和关注列表,然后再爬取他粉丝和关注的人里的用户,递归爬取,然后存储到MongoDB里。 目前还没有写代理池,爬取太频繁容易被知乎识别出来,会被要求输入验证码。所以现在我还是把settings里的AUTOTHROTTLE_ENABLED = True,延迟操作,但是爬取效率肯定会低很多。 看视频的时候request的url和翻页的url里都有/api/v4这个字符
相关文章
相关标签/搜索