使用Alluxio的Apache Spark DataFrame缓存

目录: 1.介绍 2.Alluxio和Spark训练 3.保存数据框 Spark存储级别: MEMORY_ONLY:将Java对象存储在Spark JVM内存中 MEMORY_ONLY_SER:将序列化的Java对象存储在Spark JVM内存中 DISK_ONLY:将数据存储在本地磁盘上 4.在Alluxio中查询“保存的”数据帧 5. 与Alluxio共享“保存的” DataFrame 6.
相关文章
相关标签/搜索