python爬虫系列（七）：XPath的使用

时间 2020-07-20

原文原文链接

（一）简介与安装以前咱们了解了bs4 处理HTML文档，今天来看看另外一种方式，就是lxml,也就是XPath类库。咱们能够先将HTML文件转换为XML文档，而后用Xpath查找本身想要的内容的所在节点就能够了。那么XML被设计为传输和存储数据，焦点是数据的内容，而页面HTML则是显示数据以及更好的显示数据。安装很简答，用咱们的老朋友pip 进行安装便可。pip install lxml,而不

>>阅读原文<<