1,transformation是获得一个新的RDD,方式不少,好比从数据源生成一个新的RDD,从RDD生成一个新的RDD html
2,action是获得一个值,或者一个结果(直接将RDDcache到内存中) spa
全部的transformation都是采用的懒策略,就是若是只是将transformation提交是不会执行计算的,计算只有在action被提交的时候才被触发。 .net
从运行层面来看,Transformation其实是一种链式的逻辑Action,记录了RDD演变的过程。Action则是实质触发Transformation开始计算的动做,因为在每一个Transformation的过程当中都有记录,因此每一个RDD是知道上一个RDD是怎样转变为当前状态的,因此若是出错就能够很容易的从新演绎计算过程。 orm
1. http://blog.csdn.net/map_lixiupeng/article/details/41958561 htm
2. http://www.dataguru.cn/thread-588091-1-1.html blog
3. http://my.oschina.net/hanzhankang/blog/200275 内存