Spark入门篇之简介

Spark是Apache基金会的一个顶级项目,也是Apache基金会下目前最活跃的开源项目之一,诞生于加州大学伯克利分校的AMP实验室,是一个开源的基于内存的分布式计算框架。由于Spark是基于内存的计算,相对于MapReduce来说,提高了计算速度,同时Spark也提供了高容错性和可扩展性。 1.## 速度快 基于内存的数据处理使得Spark比Mapreduce快100个数据量级以上,即使基于硬
相关文章
相关标签/搜索