spark整体概述

Spark整体概述 1.1整体概念   Apache Spark是一个开源的通用集群计算系统,他提供了High-level编程API,支持Scala,Java和Python三种编程语言。Spark内核使用scala编写,通过基于Scalade 函数式编程特性,在不同的计算层面进行抽象。 1.2 RDD抽象   RDD(Resilient Distributer Datasets),弹性分布式数据集
相关文章
相关标签/搜索