关于Spark里面的RDD.mappartitions的问题

mappartitions的执行效率要比foreachpartitions高,可是对一个一样的RDD,mappartitions里面的call方法为何不执行呢?这是懒加载的缘由,只有在使用mappartitions的结果的时候,它才会真正去调用call方法执行,好比rdd.mappartitions.collect或者rdd.mappartitions.count
相关文章
相关标签/搜索