Python爬虫——简书首页文章信息

时间 2021-01-20

标签爬虫 python 栏目 Python 繁體版

原文原文链接

运用Python对简书首要进行简书首页的文章信息进行爬取。具体包括：文章标题、文章id、用户昵称、用户id、总浏览量、评论数、点赞数、赞赏量。以及文章插图和用户头像的下载。并对以上数据进行excel的存储，首先进行文件是否存在的判断，不存在，则创建。再比较pandas包方法存储和xlwt方法。网页分析首先对简书首页网页进行分析。在查看网页源代码中按下ctrl+F键搜索“做人，不要自作多情，生活

>>阅读原文<<