1mysql 2linux 3sql 4shell 5json 6session 7数据结构 8架构 9dom 10网站 11 12 |
|
1 2 3 4 5 6 |
|
task表(mysql表)
1 2 3 4 5 6 7 8 |
|
1.j2ee平台的使用者,向平台提交任务(包含任务参数),并将任务插入到mysql表中的task表
2.Runtime,Process等API去执行一个封装了spark-submit命令的linux的shell脚本
3.而后编写jar提交spark集群中运行
1.搜索过某些关键词的用户
2.访问时间在某个时间段内的用户
3.年龄在某个范围内的用户
4.职业在某个范围内的用户
5.某个城市发起的session
功能做用:对感兴趣的用户群体进行业务分析
功能做用:从全局的角度,符合某些条件的用户群体,使用咱们的产品的一些习惯
功能做用:对于符合条件的session,按照时间比例采样,具体观察每一个session的点击流行为
数据表结构设计(MySQL面向结果)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
1 2 3 4 5 6 7 8 |
|
1 2 3 4 5 6 7 8 |
|
1 2 3 4 5 6 7 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|