Spark--分组TopN

为了获取每一个分组的topN, 首先要进行分组, 再对每一个分组进行排序,获取TopN。 测试数据 hadoop 23 spark 45 java 90 spark 57 spark 90 hadoop 99 hadoop 76 spark 45 spark 88 spark 89 hadoop 45 hadoop 90 java 78 java 70 1.一、第一步, 将源数据转化为(key,
相关文章
相关标签/搜索