Spark、Python spark、Hadoop简介

Spark、Python spark、Hadoop简介 Spark简介 1、Spark简介及功能模块 Spark是一个弹性的分布式运算框架,作为一个用途广泛的大数据运算平台,Spark允许用户将数据加载到cluster集群的内存中储存,并多次重复运算,非常适合用于机器学习算法。 Spark的核心是RDD(Resilient Distributed Dataset)弹性分布式数据集,RDD能与其他系
相关文章
相关标签/搜索