图书爬虫的进展

豆瓣的数据抓取中,豆瓣的反扒措施比较严谨,这里不得已采用了芝麻代理的ip,豆瓣的数据整理的比较好。代理

另外也对比过京东和当当的数据,发现当当的图书数据是最乱的。ip

相关文章
相关标签/搜索