Spark详解(一):Spark及其生态圈概述

1. Spark简介 Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。 Spark 运行速度快 易用性好 通用性强 随处运行 1.1 Spark和MapReduce的比较 Spark继承了其分布式并行计算的优点并改进了MapReduce明显的缺陷,具体如下: Spark把中间数据放到内存中,迭代运算效率
相关文章
相关标签/搜索