Scrapy - redis 分布式爬取淘宝商品数据

时间 2021-01-05

标签 Python 栏目 Python 繁體版

原文原文链接

上一篇文章我们用Scrapy单机爬取淘宝商品数据，由于CPU、IO和带宽等多重限制，单主机爬虫在爬取大量数据时可用性、稳定性和性能都不是很高。为了提高爬取效率、防止被网站反爬虫策略限制IP等各方面原因我们采取Scrapy分布式爬虫。 Scrapy分布式原理打造Scrapy分布式爬虫的关键是调度，因为需要将单机关联起来，我们采用的方式是消息队列。单机架构，只在本机维护一

>>阅读原文<<