Spark实现分组取 top N 示例 —— Java版

主要步骤:java 加载集合生成RDD(textFile) 对RDD进行转换,将要排序的属性进行分离,生成新的RDD(mapToPair) 对键进行分组,并在分组内基于第二步分离出的属性进行排序,并取排序结果的 top N (groupByKey,mapToPair) package rddDemo.examples; import org.apache.spark.SparkConf; imp
相关文章
相关标签/搜索