python之正则表达式以及网络爬虫

正则表达式 正则表达式 (Regular Expression) 又称 RegEx, 是用来匹配字符的一种工具. 在一大串字符中寻找你须要的内容. 它常被用在不少方面, 好比网页爬虫, 文稿整理, 数据筛选等等. 最简单的一个例子, 好比我须要爬取网页中每一页的标题. 而网页中的标题经常是这种形式.javascript <title>我是标题</ title> 并且每一个网页的标题各不相同, 我就
相关文章
相关标签/搜索