使用Spark GraphX对B站视频进行热度分析

1、前言 在文章的开始,须要先介绍下这个项目的需求。在这个小程序中,咱们首先爬取了b站部分的视频信息,筛选掉罕见的标签(能够将它们当作脏数据),再利用以前写的WordCount程序获得热词,经过聚类分析得出几类较为经常使用的标签,定义为类别,最后经过Spark GraphX图计算和可视化软件整理数据,分析出在B站哪一类视频热度较高,而且容易出现火爆现象,以及各种别中哪一个视频比较火。小程序 2、项
相关文章
相关标签/搜索