Spark入门

Spark简介 基于内存的计算框架,迭代计算效率高,基于DAG的任务调度执行机制。 应用场景 批量数据处理 Spark Core 历史数据交互查询 Spark SQL 实时数据流数据处理 Spark Streaming 历史数据挖掘机器学习 MLlib 图计算 Graph X 核心概念 RDD:是Resillient Distributed Dataset(弹性分布式数据集)的简称,是分布式内存的
相关文章
相关标签/搜索