其实这事情挺简单的,打开CSDN博客首页,他不是有个最新文章么,这个里面都是最新发布的文章。
api
本人对于Python学习建立了一个小小的学习圈子,为各位提供了一个平台,你们一块儿来讨论学习Python。欢迎各位到来 Python学习群:960410445一块儿讨论视频分享学习。Python是将来的发展方向,正在挑战咱们的分析能力及对世界的认知方式,所以,咱们与时俱进,迎接变化,并不断的成长,掌握Python核心技术,才是掌握真正的价值所在。
打开F12抓取一下数据API,很容易就获取到了他的接口学习
提取连接长成这个样子.net
https://blog.csdn.net/api/articles?type=more&category=newarticles&shown_offset=15403812340000003d
发现博客最新文章是一个瀑布流页面,不断下拉,只有一个参数shown_offset 在变化,按照我多年的行医经验,这个参数是个时间戳,并且确定是上一次数据最后一条的时间戳。cdn
基于这个理论,看一下数据,咦,猜对了~~~~~视频
博客返回的数据看一下,是否对味
blog
撸代码接口
这个步骤就很是简单了,就是经过requests去抓取这个连接就行了博客
数据获取到了,固然要象征性的保存一下requests