爬虫数据的提取--正则

数据的提取 ​ 简单的说,数据提取就是从响应中获取我们想要的数据的过程 数据的分类 非结构化的数据:html等 处理方法:正则,xpath 结构化的数据:json,xml等 处理方法:转化为python数据类型 正则表达式 ​ 正则表达式又称为规则表达式,通常被用来检索和替换哪些符合某个规则的文本 正则表达式匹配规则 python中的re模块 python中可以用内置的re模块来使用正则表达式 p
相关文章
相关标签/搜索