Python基于Scrapy-Redis分布式爬虫设计

开发环境:Python + Scrapy框架 + redis数据库 程序采用 python 开发的 Scrapy 框架来开发,使用 Xpath 技术对下载的网页进行提取解析,运用 Redis 数据库做分布式, 设计并实现了针对当当图书网的分布式爬虫程序,scrapy-redis是一个基于redis的scrapy组件,通过它可以快速实现简单分布式爬虫程序,该组件本质上提供了三大功能: schedul
相关文章
相关标签/搜索