微信公众号文章爬虫(包括阅读数、点赞数)



月小水长
一个编码者、思考者


前段时间一直在研究微信公众号爬虫,终于获得一个稳定爬取的办法,目前已稳定运行一月有余,爬取结果保存的 csv 文件结构以下web




支持爬取任意公众号的全部文章,包括连接、标题、导语、正文及原图的 URL 连接、阅读量、点赞数,支持断点下载(须要在配置文件中配置),惟一缺点可能就是为了反反爬在程序中加入了限速的代码致使效率不是很是高,爬取速度在 120篇/10分钟左右。微信


为此,特地写了一份配置教程,工具

我已经将打包成脱离 Python 环境的工具,并且不须要手机辅助;工具加入了密钥,只有通过我得到的该工具才会保证密钥的有效性,才能保证工具的顺利运行,由于我会按期更新密钥。
flex


很是欢迎有兴趣的同窗前来交流相关技术,只要有空,义务解答。编码

若是有对商业版感兴趣的话,能够小窗私聊我,由于是本人辛勤劳动的成功,但愿您能理解,感谢您的配合。
spa

本文分享自微信公众号 - 月小水长(inspurer)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。.net

相关文章
相关标签/搜索