spark架构,运行原理。

一.简介 Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。现在形成一个高速发展应用广泛的生态系统。 Spark 是一个用来实现快速而通用的集群计算的平台。 Spark 的一个主要特点就是能够在内存中进行计算,因而更快。不过即使是必须在磁盘上进行的复杂计算,Spark 依然比MapReduce 更加高效(官方称其速度比MapReduce要快100倍) Spark 所提供的接口
相关文章
相关标签/搜索