Spark:GroupByKey算子解刨

groupByKey是Transformation并且产生shuffle 上源码 可以看到调的是一个分区器里面传的是父RDD,参数里面传入一个参数和一个迭代器   传入三个函数,一个分区和一个是否聚合value布尔值 第一个函数装到CompactBuffer,这个不ArrayBuffer更高效,他将迭代器中的第一个value取出来装进CompactBuffer 第二函数是将CompactBuffe
相关文章
相关标签/搜索