Python爬虫从入门到放弃(十八)之 Scrapy爬取所有知乎用户信息(上)

本文出自“python修行路”博客,http://www.cnblogs.com/zhaof/p/7215617.html 爬取的思路 首先我们应该找到一个账号,这个账号被关注的人和关注的人都相对比较多的,就是下图中金字塔顶端的人,然后通过爬取这个账号的信息后,再爬取他关注的人和被关注的人的账号信息,然后爬取被关注人的账号信息和被关注信息的关注列表,爬取这些用户的信息,通过这种递归的方式从而爬取整
相关文章
相关标签/搜索