【Spark系列】:Spark为何比Hadoop快

1.前言 大数据工程师都喜欢拿Spark和Hadoop进行对比。通常的理解就是:Spark是基于内存的计算,而Hadoop是基于磁盘的计算;Spark是一种内存计算技术。web 果然如此吗?事实上,不光Spark是内存计算,Hadoop其实也是内存计算。Spark和Hadoop的根本差别是多个任务之间的数据通讯问题:Spark多个任务之间数据通讯是基于内存,而Hadoop是基于磁盘。算法 Spar
相关文章
相关标签/搜索