基于hadoop的网站日志数据分析

项目目标: 经过网站日志的分析,计算一些关键的指标 历史数据: 56GB  追加存储在一个文件夹 数据中的关键指标: 浏览量pv: 全部用户浏览页面的总和,一个独立用户每打开一个页面就被记录一次。此项指标能够考核用户对于网站的兴趣。对于网站运营者,更重要的是每一个栏目的浏览量。 注册用户数: 对方问注册页面的用户数计数 IP数: 一天以内,访问网站不一样独立的ip个数和,一个ip无论访问了多少次,
相关文章
相关标签/搜索