Spark入门(2)——生态系统

1.Spark简介 1.1 Spark概述 Apache Spark是一种快速和通用的集群计算系统。 它提供支持Java,Scala,Python和R的高级API和支持一般执行图的优化引擎。 它还支持一系列更高级别的工具,包括用于SQL和SQL数据处理的Spark SQL,用于机器学习的MLlib,用于图形处理的GraphX和用于实时流处理的Spark Streaming。 1.2 Hadoop和
相关文章
相关标签/搜索