JavaSpark-编程进阶-广播变量

程序高效地向全部worker发送一个较大的只读值(查询表,机器学习特征向量),供spark操做使用。 spark会自动将闭包中全部引用的到的变量发送到工做节点上,但低效:java 默认的发送机制是专门为小任务进行优化的 多个并行操做中使用同一个变量,spark会为每个操做分别发送 import java.util.Arrays; import java.util.List; import org
相关文章
相关标签/搜索