Spark 经常使用api介绍

topweb val rdd = sc.parallelize(Array(23,67,12,90,8,67)) rdd.first rdd.take(5) //top全局排序,耗内存 rdd.top(1) res24: Array[Int] = Array(90) rdd.top(2) res25: Array[Int] = Array(90, 67) sortByKeysvg scala> w
相关文章
相关标签/搜索