豆瓣一连,500热评真得具有代表性吗?

上次写了一篇关于《北灵少年志之大主宰》的短评分析链接1,用热评500是在无法取得完整短评下不得已为之的结果,现在咱们来重申一个问题,豆娘放出来的短评top500,真的是能代表全体的意见领袖吗? 考虑用统计模型进行验证。 豆瓣数据爬虫 首先是样本影视名录,选取热榜300条(实际用到的50+),Python爬虫可参考链接2,整理后如图: 然后爬取每篇文章的豆瓣短评,超过500的按500爬,不足500的
相关文章
相关标签/搜索