大数据清洗阶段2

补一下前天的进度数据库

前天主要完成了清洗之后的数据导入hive以及数据的处理(统计前10个)ide

下一阶段计划完成数据可视化展现spa

 

 

2.数据处理3d

1.统计最受欢迎的视频/文章的Top10访问次数 (video/article)视频

视频:blog

 

 

 

 

文章:ip

 

 

 

2.按照地市统计最受欢迎的Top10课程 (ip)数据可视化

没有理解这个题什么意思 可视化

我理解的是分别统计每一个城市最受欢迎的前10个课程 而后我按IP和id进行分组 可是这样出来的结果不对 不知道咋整im

 

 

3.·按照流量统计最受欢迎的Top10课程 (traffic)

 

 

 

 

 

3、数据可视化:将统计结果倒入MySql数据库中,经过图形化展现的方式展示出来。

将HIVE中的表数据导出到临时文件中

相关文章
相关标签/搜索