爬取糗事百科

任务:爬取糗事百科发布者和发布内容 实现: 糗事百科的段子还是很不错的,刚开始爬虫的同学们可以拿它练练手哦。 下面上代码啦,请求头headers是很重要哒,还要注意编码问题呦,这个编码问题可以抽出时间 来专门研究他哟。 还有这次的正则有点不太好写,正则很有用的,要学会呦。 # -*- coding:utf-8 -*- import urllib2 import re import sys relo
相关文章
相关标签/搜索