Spark源码分析 -- PairRDD

和通常RDD最大的不一样就是有两个泛型参数, [K, V]表示pair的概念 关键的function是, combineByKey, 全部pair相关操做的抽象html combine是这样的操做, Turns an RDD[(K, V)] into a result of type RDD[(K, C)] 其中C有可能只是简单类型, 但常常是seq, 好比(Int, Int) to (Int,
相关文章
相关标签/搜索