Spark Standalong模式运行原理解析

一、概述    Apache Spark是一种快速和通用的集群计算系统。它提供Java,Scala,Python和R中的高级API,以及支持一般执行图的优化引擎。它还支持一组丰富的更高级别的工具,包括Spark SQL用于SQL和结构化数据的处理,MLlib机器学习,GraphX用于图形处理和Spark Streaming。    Spark除了在Mesos或YARN群集管理器上运行,它还提供了一
相关文章
相关标签/搜索