Spark简介和RDD基本命令

1.Spark概念和特色 Spark是什么 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎 是开源的,基于内存计算的大数据并行计算框架 由UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室) 开发 拥有Hadoop MapReduce的优势, 同时避免读写HDFS Spark和Hadoop MR的关系 Spark 启用了内存分布数据集,提供交互式查
相关文章
相关标签/搜索