总结经常使用的Transformation算子和Action算子,及基本用法

只有是Action时,才会执行当即操做。 Transformation是 lazy的操做,不会当即执行,执行Transformation的算子时,会返回一个新的RDD,依赖上一个RDDweb transformation: 一、sortBy : 对于RDD的是非元组型,rdd1.soreBy(x=>x),元组型按value排序 rdd.soreBy(_._2)(进行shuffle) 二、sor
相关文章
相关标签/搜索