Scrapy:Python的爬虫框架

网络爬虫,是在网上进行数据抓取的程序,使用它能够抓取特定网页的 HTML 数据。虽然我们利用一些库开发一个爬虫程序,但是使用框架可以大大提高效率,缩短开发时间。Scrapy 是一个使用 Python 编写的,轻量级的,简单轻巧,并且使用起来非常的方便。 Scrapy 使用了 Twisted 异步网络库来处理网络通讯。整体架构大致如下: Scrapy 主要包括了以下组件: 1、引擎:用来处理整个系统
相关文章
相关标签/搜索