spark 大型项目实战(二十):用户访问session分析(二十) --session随机抽取之实现思路分析

文章地址:http://www.haha174.top/article/details/253333 每一次执行用户访问session分析模块,要抽取出100个session session随机抽取:按每天的每个小时的session数量,占当天session总数的比例,乘以每天要抽取的session数量,计算出每个小时要抽取的session数量;然后呢,在每天每小时的session中,随机抽取出之
相关文章
相关标签/搜索