弹性分布式数据集rdd_弹性分布式数据集(RDD)

弹性分布式数据集rdd 在这篇文章中,我将提到RDD论文, 弹性分布式数据集:内存中群集计算的容错抽象 。 如果您没有阅读有关Spark的文章,我强烈建议您从这里阅读: Spark:带有工作集的集群计算 。 RDD抽象 RDD是一种分布式内存抽象,可利用应用程序性能,因为它以容错的方式适用于迭代算法和交互式数据挖掘工具。 其他集群计算框架(如MapReduce和Dryad)缺乏利用分布式内存的抽象
相关文章
相关标签/搜索