Spark核心编程-RDD操作原理分析

一、union算子内部实现原理剖析 说明:将两个RDD合并,返回两个RDD的并集,返回元素不去重。 二、groupByKey算子内部实现原理剖析 说明:将RDD[K, V]中每个K对应的V值合并到一个集合Iterable[V]中。 三、reduceByKey算子内部实现原理剖析 说明:将RDD[K, V]中每个K对应的V值根据映射函数来运算。 四、distinct算子内部实现原理剖析 说明:去除R
相关文章
相关标签/搜索