spark 缓存篇

spark数据集市RDD,这里有个很重要的特性是RDD能够选择存储起来让另外的action操做,下面是各类缓存级别 [color=red]存储方式[/color]:RDD的持久化或缓存选项是经过persist()或cache() [color=red]备注[/color]:1.RDD中的数据具备容错性; 2.Shuffle操做是不须要指定cache()或者persist()的,会自动缓存rdd结果
相关文章
相关标签/搜索