urllib实战4--新闻爬虫（020）

时间 2021-01-20

原文原文链接

一：需求与思路需求：将新浪新闻的首页的所有新闻爬取到本地 http://news.sina.com.cn/ 思路：首先爬首页，通过正则表达式获取所有的新闻链接，然后依次爬取新闻，并存储到本地。二：实战运行程序查看爬取结果：三：综上代码： from urllib import request import re data=request.urlope