网络爬虫——基础大体结构

时间 2019-12-11

原文原文链接

网络爬虫爬虫的应用领域相关工具一个简单的爬虫方法一：python自带的方式：urllib urlopen(url).read()表示获取到url地址而后.decode(参数)解码原生方法须要用正则表达式去获取页面中想要的参数方法二：第三方BeautifulSoup 须要记住的是得到网站后用content.decode()解码 BeautifulSoup解析页面须要将里面参数改成lxml

>>阅读原文<<