离线处理网站的PV,UV方案

流程: 导入数据hdfs(flume-->hdfs) 创建hive表 把hdfs上的数据导入到hive表里面 数据清洗-->(先有一个数据清洗表) 数据分析,数据统计-->存放一张表里面 把hive表的数据导出到,mysql中 把mysql里面的㐇给查出来,展现到页面 何为PV? PV(page view)访问量,即页面浏览量或点力量,衡量网站用户访问的网页数量;html 在必定统计周期内用户没打
相关文章
相关标签/搜索