【Spark系列】：Spark为何比Hadoop快

时间 2019-12-07

原文原文链接

1.前言大数据工程师都喜欢拿Spark和Hadoop进行对比。通常的理解就是：Spark是基于内存的计算，而Hadoop是基于磁盘的计算；Spark是一种内存计算技术。web 果然如此吗？事实上，不光Spark是内存计算，Hadoop其实也是内存计算。Spark和Hadoop的根本差别是多个任务之间的数据通讯问题：Spark多个任务之间数据通讯是基于内存，而Hadoop是基于磁盘。算法 Spar

>>阅读原文<<