Spark基础概念

此文章打算梳理之前项目所用过的Spark的一些基础概念。 Spark是一个计算框架 Hadoop是包含计算框架MapReducehe分布式文件系统HDFS。 Spark是基于内存的 Spark: Spark有四大组件包括Spark Streaming、Spark SQL、Spark MLlib和Spark GraphX。 四大组件的应用场景可以参考这篇文章:http://f.dataguru.cn
相关文章
相关标签/搜索