Spark快速大数据分析之第三章RDD编程

RDD基础 RDD包含两种操做:python 转化操做:由一个 RDD 生成一个新的 RDD,采起惰性求值策略:不会立刻进行运算,直到下一个行动操做才会运算安全 行动操做:对 RDD 计算出一个结果,并把结果返回到驱动器程序中,或把结果存储到外部存储系统(如 HDFS)中函数 惰性求值code 虽然你能够在任什么时候候定义新的 RDD,但 Spark 只会惰性计算这些 RDD。它们只有第一次在一个
相关文章
相关标签/搜索