Spark和MapReduce的比较(包含磁盘内存,算子,粗粒度资源申请和细粒度资源申请)【文字说明原理+图片】

Spark是开源的通用的计算框架,目的是为了使数据分析更快。MR也是计算框架。         区别?             1).MR是基于磁盘迭代,Spark是基于内存迭代。             2).Spark中有DAG有向无环图。             3).MR中只有map,reduce两个类,相当于Spark中两个算子。Spark中有三类算子(转换算子,行动算子,持久化算子)。
相关文章
相关标签/搜索