Python爬虫基础——正则表达式

说到爬虫,不可避免的会牵涉到正则表达式。 因为你需要清晰地知道你需要爬取什么信息?它们有什么共同点?可以怎么去表示它们? 而这些,都需要我们熟悉正则表达,才能更好地去提取。 先简单复习一下各表达式所代表的意思: 案例: 定义密码的正则表达式: 英文字母开头,可以包括数字、大小写英文字母、下划线,6-16位。 表达式为: password_pattern='^[a-zA-Z]{1}[a-zA-Z0-
相关文章
相关标签/搜索