1)Spark(概述、运行模式)

什么是Spark: Spark是一个基于内存的快速、通用、可扩展的大数据分析引擎;html Spark内置模块: SparkCore: 实现了Spark的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等模块。Spark Core中还包含了对弹性分布式数据集(Resilient Distributed DataSet,简称RDD)的API定义; SparkSQL:是Spark用来操做结构
相关文章
相关标签/搜索