Spark的Stage划分

文章目录 0x01 宽依赖和窄依赖 0x02 Stage 0x03 Stage的划分 为什么遇到宽依赖需要切分Stage? 0x01 宽依赖和窄依赖 窄依赖: 父RDD的每个分区最多被子RDD的一个分区所用(一个父RDD分区对应一个子RDD分区),即父RDD的数据没有被重新规划分区(没有被重新洗牌)。 宽依赖: 父RDD的每一个分区被子RDD的所有分区所用(一个父RDD分区的数据被分发到子RDD的
相关文章
相关标签/搜索