selenium抓取bilibili拜年祭《千里以外》的评论

bilibili 2019年拜年祭的《千里以外》很好看,因而我想用《python爬虫开发从入门到实战》第七章的爬虫技术抓取一下评论。打开页面观察源码和network发现是用ajax异步加载的,直接访问打不开,须要伪造headers,有些麻烦。(实际上伪造很是简单,可是从json串里提取结果很麻烦,远没有直接从网页的xpath提取简单,见ajax_get_comment方法。其中CrawlerUti
相关文章
相关标签/搜索