Spark基础知识之概念<二>

                           Spark基础知识<二> Spark的概念:Spark是分布式的、主要基于内存的、特别适合于迭代计算的大数据计算框架。 接下来从3个方面去理解Spark的概念: 分布式:所谓分布式就是有很多台机器在运行,每个机器运行任务中的一部分,提高了任务运行的效率。 主要基于内存:Spark在计算的过程中会优先将数据放在内存中,如果内存容量不足的话,Spa
相关文章
相关标签/搜索