元数据与数据治理|Spark初探(第四篇)

                                         文章进行了部分简化(元数据与数据治理系列文章)html 认识Sparkjava Spark是一个开源的分布式计算系统,它的目的是使得数据分析更快——写起来和运行起来都很快。shell Spark 是基于内存计算的大数据并行计算框架。Spark 基于内存计算,提升了在大数据环境下数据处理的实时性,同时保证了高容错性和高
相关文章
相关标签/搜索