Spark 共享变量——累加器(accumulator)与广播变量(broadcast variable)

累加器(accumulator) 咱们传递给Spark的函数,如map(),或者filter()的判断条件函数,可以利用定义在函数以外的变量,可是集群中的每个task都会获得变量的一个副本,而且task在对变量进行的更新不会被返回给driver。而Spark的两种共享变量:累加器(accumulator)和广播变量(broadcast variable),在广播和结果聚合这两种常见类型的通讯模式上
相关文章
相关标签/搜索