Spark RDD上的map operators是如何pipeline起来的

本文原文(点击下面 阅读原文 即可进入):https://www.jianshu.com/p/45c9ee55eea6 最近在工作讨论中,同事提出了这么一个问题:作用在一个RDD/DataFrame上的连续的多个map是在对数据的一次循环遍历中完成的还是需要多次循环? 当时我很自然地回答说:不需要多次循环,spark会将多个map操作pipeline起来apply到rdd partition的每个
相关文章
相关标签/搜索