46.top10活跃session之分组取TopN算法获取top10活跃session

本文为《Spark大型电商项目实战》 系列文章之一,主要介绍本模块的核心,也就是实现TopN算法,以获取top10活跃session。javascript 代码实现 /** * 第三步:分组取topN算法实现,获取每一个品类的top10活跃用户 */ JavaPairRDD<Long, Iterable<String>> top10CategorySessionCountsRDD
相关文章
相关标签/搜索