Python Scrapy使用Selector、xpath、css选择器提取数据

时间 2020-01-15

标签 python scrapy 使用 selector xpath css 选择器提取数据栏目 Python 繁體版

原文原文链接

从页面中提取数据的核心技术是HTTP文本解析，在Python 中经常使用如下模块处理此类问题:css BeautifulSoup lxml 很是流行的HTTP解析库，API 简洁易用，但解析速度较慢。由C语言编写的xml解析库( libxml2)，解析速度更快，API相对复杂。 Scrapy综合上述二者优势实现了Selector 类，它是基于lxml库构建的，并简化了API接口。在Scrapy中

>>阅读原文<<