学习之路——Spark(3)——Spark RDD内部结构

本文原地址在 www.zicesun.com icesuns.github.io Spark是一个基于分布式内存的大数据计算框架,RDD (Resilient Distributed Dataset)是Spark最重要的一个数据抽象。这篇文章记录了我对RDD的一些理解,有不足和错误的地方,请留言指正。 什么是RDD RDD (Resilient Distributed Dataset),弹性分布式
相关文章
相关标签/搜索