Spark:Java实现 二次排序

测试数据java 1 5 2 4 3 6 1 3 2 1 输出结果web 1 3 1 5 2 1 2 4 3 6 实现思路:算法 1.实现自定义的key,要实现Ordered接口和Serializable接口,在key中实现本身对多个列的排序算法 2.将包含文本的RDD,映射成key为自定义key,value为文本的JavaPariRDD 3.使用sortByKey算子按照自定义的key进行排序
相关文章
相关标签/搜索