详解使用Python爬取豆瓣短评并绘制词云

使用Python爬取豆瓣短评并绘制词云 成果如下(比较丑,凑合看) 1.分析网页 打开想要爬取的电影,比如《找到你》,其短评如下: 查看源代码 发现短评存放在<span>标签里 并且class为short,所以通过爬取其里边的内容即可 并且通过翻页发现:url改变的仅仅为start,每次翻页增加20,所以只需for循环增加数字即可控制页数 2.获取其网页内容 我们使用bs4以及requests模块
相关文章
相关标签/搜索