大数据学习笔记(spark日志分析案例)

前提:500w条记录环境下(可以更多,视计算机性能而定),统计每天最热门的top3板块。 1、PV和UV 我们要统计的是最热门的top3板块,而热门如果只是简单地通过页面浏览量(PV)或者用户浏览量(UV)来决定都显得比较片面,这里我们综合这两者(0.3PV+0.7UV)来获取我们的需求。 1.1、PV PageView:浏览量。(有几次浏览就算几次)    1.2、UV UserView:用户量
相关文章
相关标签/搜索