Spark RDD详解

http://www.cnblogs.com/cenyuhai/p/3779125.html   最近在阅读源码,发现这篇博客内容非常好,有助于快速理解代码。       1、什么是RDD?   上一章讲了Spark提交作业的过程,这一章我们要讲RDD。简单的讲,RDD就是Spark的input,知道input是啥吧,就是输入的数据。 RDD的全名是Resilient Distributed Da
相关文章
相关标签/搜索