RDD经常使用算子的一些注意要点。

产生shuffle的算子,分区操做:repartition,coalesce。‘ByKey’操做(除了counting)如:groupByKey和reduceByKey。join操做:cogroup和join repartition源码:web /** * Return a new RDD that has exactly numPartitions partitions. *
相关文章
相关标签/搜索