urllib实战4--新闻爬虫(020)

一:需求与思路       需求:将新浪新闻的首页的所有新闻爬取到本地   http://news.sina.com.cn/       思路:首先爬首页,通过正则表达式获取所有的新闻链接,然后依次爬取新闻,并存储到本地。 二:实战       运行程序 查看爬取结果: 三:综上代码: from urllib import request import re data=request.urlope
相关文章
相关标签/搜索