[爬虫系列(一)]爬取豆瓣电影排行前250

这是个小爬虫,基于python2.7.主要用到了BeautifulSoup库和urllib2的urlopen,爬取豆瓣电影排行前250,并保存在文件中. 主要分为三个步骤: * 分析url * 分析网站数据 * 爬取数据python 一.分析url 豆瓣电影排行榜250的url很好分析: 格式都是这样子的:git http://movie.douban.com/top250?start=(page
相关文章
相关标签/搜索
本站公众号
   欢迎关注本站公众号,获取更多信息