Spark初体验

spark 很秀,号称比hadoop快很多,虽然是内存运行,但是即使在磁盘上运行,也比MapReduce快不少。 官网上也是一点不低调,有图为证 其架构大致如下 spark sql 操作数据化结构的程序包 spark streaming 对实时数据进行流式计算的组件 MLlib 提供常见的机器学习程序库 GraphX 操作图,进行并行的图计算 spark做计算主要是对RDD进行操作 创建RDD 可
相关文章
相关标签/搜索