Spark生态和Spark架构

Spark概览 Spark 是一个通用的大规模数据快速处理引擎。能够简单理解为 Spark 就是一个大数据分布式处理框架。 Spark是基于map reduce算法实现的分布式计算框架,但不一样的是Spark的中间输出和结果输出能够保存在内存中,从而再也不须要读写HDFS,所以Spark能更好地用于数据挖掘与机器学习等须要迭代的map reduce的算法中。node Spark生态系统BDAS 伯
相关文章
相关标签/搜索