持久化级别
|
|
MEMORY_ONLY
|
以非序列化的Java对象的方式持久化在JVM内存中。若是内存没法彻底存储RDD全部的partition,那么那些没有持久化的partition就会在下一次须要使用它的时候,从新被计算
|
MEMORY_AND_DISK
|
同上,可是当某些partition没法存储在内存中时,会持久化到磁盘中。下次须要使用这些partition时,须要从磁盘上读取
|
MEMORY_ONLY_SER
|
同MEMORY_ONLY,可是会使用Java序列化方式,将Java对象序列化后进行持久化。能够减小内存开销,可是须要进行反序列化,所以会加大CPU开销
|
MEMORY_AND_DSK_SER
|
同MEMORY_AND_DSK。可是使用序列化方式持久化Java对象
|
DISK_ONLY
|
使用非序列化Java对象的方式持久化,彻底存储到磁盘上
|
MEMORY_ONLY_2
MEMORY_AND_DISK_2
等等
|
若是是尾部加了2的持久化级别,表示会将持久化数据复用一份,保存到其余节点,从而在数据丢失时,不须要再次计算,只须要使用备份数据便可
|