Spark学习(一)Spark及其生态圈简介

1、什么是Spark Apache Spark™是用于大规模数据处理的统一分析引擎。 Spark的通用性: 2、Spark的四大特性 (1)Speed:高效性 运行速度快  Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是Hadoop MapReduce的10倍以上,如果数据从内存中读取,速度可以高达100多倍。  (2)Ease of
相关文章
相关标签/搜索