关于spark中cache和广播变量的区别

RDD分为多个分区。这些分区自己充当整个RDD的不可变子集。当Spark执行图的每一个阶段时,每一个分区都会被发送给一个工做在该数据子集上的工做者。反过来,若是RDD须要从新迭代,每一个工做人员能够缓存数据。html 广播变量用于向每一个工做人员发送一次不可变状态。当你想要一个变量的本地副本时使用它们。程序员 这两个操做彼此彻底不一样,每一个操做表明一个不一样问题的解决方案。算法 当持久化 RDD
相关文章
相关标签/搜索