Spark之Action算子(一)

Spark算子分为两大类,本文介绍Action类算子。数组 (1)reduce算子函数 按照官网的解释,传入的参数是一个函数,一个双参数,返回值惟一的函数,建议,该函数是可交换的,是可联合的,如此,才能实现正确的并行计算。oop 这里的函数,我平时用过加法操做,最大值操做,最小值操做;记得大数据里提过这个概念,诸如此类能够合并操做的函数,是最合适的,平均值类的,就不适用于此种操做了。大数据 如上图
相关文章
相关标签/搜索