弹性分布式数据集:一种对内存集群计算的容错抽象(二)

说明: 本文是翻译自讲述Spark核心设计思想的经典论文“Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing”。在翻译的过程中,更系统的理解了Spark中的RDD设计起源、优点与实际应用场景。阅读这样的经典文章,读者也能了解到一个大型的数据处理系统,是怎样被设计出来
相关文章
相关标签/搜索