spark第一篇:RDD Programming Guide

预览html 在高层次上,每个Spark应用(application)都包含一个驱动程序(driver program),该程序运行用户的主函数(main function),并在集群上执行各类并行操做。java Spark提供的主要抽象是一个弹性分布式数据集(resilient distributed dataset,简称RDD),它是在集群节点间进行分区的元素集合,能够并行操做。RDD是经过H
相关文章
相关标签/搜索