python爬虫实战(2)--爬取百度贴吧

本篇目标 1.对百度贴吧的任意帖子进行抓取 2.指定是否只抓取楼主发帖内容 3.将抓取到的内容分析并保存到文件 1.URL格式的确定 先观察百度贴吧url格式,以中南财经政法大学迎新帖为例,URL我们划分基础部分是 http://tieba.baidu.com/p/5174106966,参数部分是 ?see_lz=1&pn=1 2.页面的抓取 一个初始化方法,一个获取页面的方法。另外,获取页面的方
相关文章
相关标签/搜索