《Spark与Hadoop大数据分析》——2.2　Apache Spark概述

时间 2020-12-30

原文原文链接

2.2　Apache Spark概述 Hadoop和MR已有10年历史，已经被证明是高性能处理海量数据的最佳解决方案。然而，MR在迭代计算中性能不足，在这种情况下，多个MR作业之间的输出必须被写入 HDFS。在单个MR作业中，它的性能不足则是因为MR框架存在的一些缺点所致。让我们来看看计算趋势的发展历史，以便了解计算的格局在过去20年中的变化。这个趋势是当网络成本更低时（1990年代）对URI

>>阅读原文<<

《Spark与Hadoop大数据分析》——2.2 Apache Spark概述

《Spark与Hadoop大数据分析》——2.2　Apache Spark概述