Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践...

下面看下union的使用: 使用collect操作查看一下执行结果: 再看下groupByKey的使用: 执行结果:   join操作就是一个笛卡尔积操作的过程,如下示例:   对rdd3和rdd4执行join操作:   使用collect查看执行结果: 可以看出join操作完全就是一个笛卡尔积的操作; reduce本身在RDD操作中属于一个action类型的操作,会导致job的提交和执行: 下面
相关文章
相关标签/搜索