Spark RDD

转自:https://blog.csdn.net/u011564172/article/details/53310530 概要         RDD是为了处理迭代算法和数据发掘应运而生的,keep数据在内存,显著提升性能。         RDD基于lineage实现容错,而不是shared state的update。 简介        背景        原有的并行框架MapReduce无法
相关文章
相关标签/搜索