Spark理论部分

一、spark简介      spark是AMP实验室开发的通用内存并行计算框架,使用scala语言实现的。运行速度快,易用性好,通用性强等特点,spark是在借鉴了MapReduce之上发展而来的,继承了其分布式并行计算的优点并改进了MapReduce明显的缺陷,如果说MapReduce是第一代并行计算框架的话,那么Spark就是第二代了。 具体区别主要有以下几点: Spark把中间数据放在内存
相关文章
相关标签/搜索