大数据技术——Spark

作者:翁松秀 大数据技术——Spark Spark简介 Spark是一种通用的大规模数据分析引擎,由于Spark是基于内存的分析引擎,所以它比基于硬盘的MapReduce效率要高许多。 Spark的优势: 高效性:基于内存的计算比MapReduce快差不多100多倍,而基于硬盘的计算也比MapReduce快10多倍。 易使用性:开发Spark可以采用两种方式,一种是内置的spark-shell,另
相关文章
相关标签/搜索