SPark 中RDD的介绍

目录 背景描述 RDD介绍 1.基本概念 2.spark接口 3.RDDs接口5个特性 4.RDDs依赖关系 5.作业调度 6.内存管理 7.检查点支持(checkpoint)  最后总结   背景描述        在hadoop中一个独立的计算,例如在一个迭代过程中,除可复制的文件系统(HDFS)外没有提供其他存储的概念,这就导致在网络上进行数据复制而增加了大量的消耗,而对于两个的MapRed
相关文章
相关标签/搜索