爬取糗事百科的段子

把糗事百科的段子信息爬取下来保存在txt文件内,内容有 用户名: 年龄: 好笑指数: 评论数: 段子内容: 借助火狐浏览器可以方便的查看网页源代码以及审查元素,便于爬取内容 此爬取的知识点:正则表达式 其实正则表达式是爬取代码的核心,熟练掌握是爬取普通网页的关键 一下是正则表达式的一些关键用法: # coding: utf-8 # 网页请求包 import requests # 正则表达式包 im
相关文章
相关标签/搜索