spark中RDD算子介绍

1. spark简介 Spark可以用于批处理、交互式查询(Spark SQL)、实时流处理(Spark Streaming)、机器学习(Spark MLlib)和图计算(GraphX)。 Spark是MapReduce的替代方案,而且兼容HDFS、Hive,可融入Hadoop的生态系统,以弥补MapReduce的不足。 2. RDD简介 RDD(Resilient Distributed Dat
相关文章
相关标签/搜索