spark的coalesce和repartition算子管理分区

源码地址https://github.com/apache/spark/blob/v2.4.0/core/src/main/scala/org/apache/spark/rdd/RDD.scala repartition: / ** *返回一个具有正确numPartitions分区的新RDD。 * *可以增加或减少此RDD中的并行度。在内部,这使用 *重新分配数据的随机播放
相关文章
相关标签/搜索