大数据知识点—spark概念,核心架构,运行流程

概念 Spark 提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据 集和数据源(批量数据或实时的流数据)的大数据处理的需求。 核心架构 Spark Core 包含 Spark 的基本功能;尤其是定义 RDD 的 API、操作以及这两者上的动作。其他 Spark 的库都 是构建在 RDD 和 Spark Core 之上的 Spark SQL 提供通过 Apache H
相关文章
相关标签/搜索