Spark RDD 特征及其依赖

1 RDD特征 分区(partition) 有一个数据分片列表,可以将数据进行切分,切分后的数据可以进行并行计算,是数据集的原子组成部分web 函数 compute 计算每一个分片,得出一个可遍历的结果,用于说明在父RDD上执行何种计算apache 依赖 dependency 计算每一个RDD对父RDD的依赖列表,源RDD没有依赖,经过依赖关系描述血统(lineage)app 优先位置(可选) 每
相关文章
相关标签/搜索