弹性分布式数据集(RDD)

在这篇文章中,我将提到RDD论文,“ 弹性分布式数据集:内存中群集计算的容错抽象” 。 如果您没有阅读有关Spark的文章,我强烈建议您从这里阅读: Spark:带有工作集的集群计算 。 RDD抽象 RDD是一种分布式内存抽象,它利用了应用程序的性能,因为它以容错的方式适用于迭代算法和交互式数据挖掘工具。 其他集群计算框架(例如MapReduce和Dryad)缺乏利用分布式内存的抽象概念。 因此,
相关文章
相关标签/搜索