关于python爬虫的学习总结

爬虫的五个步骤 明确需求,想想爬什么数据 确定含有需要数据的网站 分析请求类别,请求时所携带的参数,模拟发送请求 下载页面,分析页面,通过re,xpath来过滤response中返回的数据 将数据储存起来 正则表达式 正则表达式的定义 描述了一种字符串的匹配模式,可以用来检查一个串是否含有某种字串,见匹配到的字串替换成其他的字符或者取出 应用场景 测试字符串的是否符合某个模式 批量替换文本中符合某
相关文章
相关标签/搜索