SparkCore>RDD容错机制Checkpoint

文章目录 引入 代码演示 查看结果: 总结 引入 持久化的局限 持久化/缓存能够把数据放在内存中,虽然是快速的,可是也是最不可靠的;也能够把数据放在磁盘上,也不是彻底可靠的!例如磁盘会损坏等。node 问题解决 Checkpoint的产生就是为了更加可靠的数据持久化,在Checkpoint的时候通常把数据放在在HDFS上,这就自然的借助了HDFS天生的高容错、高可靠来实现数据最大程度上的安全,实现
相关文章
相关标签/搜索