[python web scraping 2nd edition]2 笔记

2.1 3种抓取网页的方法 1.正则表达式 使用正则表达式匹配网页中的元素。 此方案的弊端是,网页若发生变化,则方法很可能会失效。同时该方法存在难以构造、可读性差等问题。 2.Beautiful Soup Beautiful Soup是Python模块,可解析网页,并提供了定位元素的接口。 Beautiful Soup首先将网页解析成soup文档,接着利用find()、find_all()等定位元
相关文章
相关标签/搜索