PYTHON抓取网页总结

一、需要用到的包 1、re:正则表达式处理包 正则表达式匹配原理图 正则表达式的大致匹配过程是:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界,这个过程会稍微有一些不同。 Python支持的正则表达式元字符和语法: 注: Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;
相关文章
相关标签/搜索