spark算子reducebykey和groupbykey的对比

一、场景 reducebykey和groupbykey作为经常使用的算子,都会触发shuffle操作 1.reducebykey返回的k-v的tuple的rdd 2.groupbykey返回的k-iterable的tuple的rdd 二、源码解读 这两个方法的底层都调用了combineByKeyWithClassTag这个方法 groupbykey 调用   reducebykey调用   第五个
相关文章
相关标签/搜索