Spark基础概念梳理

因为最近在学习与使用Spark,所以对一些基础概念与术语做一些梳理。用来加深映像同时方便后续复习 spark是一个基于内存的分布式计算框架,可无缝集成于现有的Hadoop生态体系。主要包括四大组件:Spark Streaming、Spark SQL、Spark MLlib和Spark GraphX。 Spark运行中涉及到的一些基础概念如下: mater:主要是控制、管理和监督整个spark集群
相关文章
相关标签/搜索