Spark学习笔记(一):Spark简介和RDD

前言:这是Spark理论的学习笔记,代码和操作极少,请自行熟悉代码。这篇幅会越来越长,并且不断深入,没什么意外的话笔者会在空闲时候慢慢进行更新。如果有错误的地方,请大佬指出让我改进,感激不尽! 1.Spark概述 1.1简介 Spark是一种快速、通用、可扩展的大数据分析引擎,是基于内存计算的大数据分布式计算框架。基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,
相关文章
相关标签/搜索