Apache Spark

Apache Spark 一、概述 Spark是⼀个快如闪电的统⼀分析引擎(计算框架)⽤于⼤规模数据集的处理。Spark在做数据的批处理 计算,计算性能⼤约是Hadoop MapReduce的10~100倍,因为Spark使⽤⽐较先进的基于 DAG 任务调 度,可以将⼀个任务拆分成若⼲个阶段,然后将这些阶段分批次交给 集群计算节点 处理。 1、MapReduce VS Spark MapReduc
相关文章
相关标签/搜索