《Spark与Hadoop大数据分析》——2.2 Apache Spark概述

2.2 Apache Spark概述 Hadoop和MR已有10年历史,已经被证明是高性能处理海量数据的最佳解决方案。然而,MR在迭代计算中性能不足,在这种情况下,多个MR作业之间的输出必须被写入 HDFS。在单个MR作业中,它的性能不足则是因为MR框架存在的一些缺点所致。 让我们来看看计算趋势的发展历史,以便了解计算的格局在过去20年中的变化。 这个趋势是当网络成本更低时(1990年代)对URI
相关文章
相关标签/搜索