补一下前天的进度数据库
前天主要完成了清洗之后的数据导入hive以及数据的处理(统计前10个)ide
下一阶段计划完成数据可视化展现spa
2.数据处理3d
1.统计最受欢迎的视频/文章的Top10访问次数 (video/article)视频
视频:blog
文章:ip
2.按照地市统计最受欢迎的Top10课程 (ip)数据可视化
没有理解这个题什么意思 可视化
我理解的是分别统计每一个城市最受欢迎的前10个课程 而后我按IP和id进行分组 可是这样出来的结果不对 不知道咋整im
3.·按照流量统计最受欢迎的Top10课程 (traffic)
3、数据可视化:将统计结果倒入MySql数据库中,经过图形化展现的方式展示出来。
将HIVE中的表数据导出到临时文件中