python爬虫系列(七):XPath的使用

(一)简介与安装 以前咱们了解了bs4 处理HTML文档,今天来看看另外一种方式,就是lxml,也就是XPath类库。咱们能够先将HTML文件转换为XML文档,而后用Xpath查找本身想要的内容的所在节点就能够了。那么XML被设计为传输和存储数据,焦点是数据的内容,而页面HTML则是显示数据以及更好的显示数据。 安装很简答,用咱们的老朋友pip 进行安装便可。pip install lxml,而不
相关文章
相关标签/搜索