HTML网页解析之Xpath,bs4及re

HTML网页解析篇 1.经常使用工具介绍 Xpath:XPath即为XML路径语言(XML Path Language),它是一种用来肯定XML文档中某部分位置的语言。 bs4:一个HTML/XML 的解析器,主要用于解析和提取 HTML/XML 数据。 re:正则表达式是一种通用的字符串表达框架,用来基于匹配模式测试字符串内的模式,替换文本和查找文本。 2.各工具详解 2.1 Xpath XPa
相关文章
相关标签/搜索