SPARK SQL华为应用现状分析

SPARK是一个分布式的基于内存的大数据执行引擎,最先由加州伯克利大学AMP Lab主导开发,后来加入apache社区孵化,进而成为apache顶级大数据项目。目前spark在开源社区和工业界很是火爆,堪称大数据最活跃的开源项目。Spark在大数据领域之因此受到如此青睐,主要源于以下几方面优点:html 数据集抽象: 提供一个分布式弹式数据集(RDD,ResilientDistributed Da
相关文章
相关标签/搜索