《PYTHON3网络爬虫开发实践》——第四章 解析库的使用

第四章 解析库的使用 4.1 XPath 对于网页的节点来说,它可以定义id、 class或其他属性。而且节点之间还有层次关系,在网页中可以通过XPath或CSS选择器来定位一一个或多个节点。那么,在页面解析时,利用XPath或CSS选择器来提取某个节点,然后再调用相应方法获取它的正文内容或者属性,就可以提取我们想要的任意信息了。 XPath提供了超过100个内建函数,用于字符串、数值、时间的匹配
相关文章
相关标签/搜索