网络爬虫——基础大体结构

网络爬虫 爬虫的应用领域 相关工具 一个简单的爬虫 方法一:python自带的方式:urllib urlopen(url).read()表示获取到url地址而后.decode(参数)解码 原生方法须要用正则表达式去获取页面中想要的参数 方法二:第三方BeautifulSoup 须要记住的是得到网站后用content.decode()解码 BeautifulSoup解析页面须要将里面参数改成lxml
相关文章
相关标签/搜索