JavaShuo
栏目
标签
图解spark RDD缓存管理cacheManager和磁盘管理DiskStore/DiskBlockManager
时间 2021-01-20
标签
大数据
栏目
Spark
繁體版
原文
原文链接
RDD缓存管理cacheManager 当需要计算RDD时,需要避免重复计算的RDD。 什么时候RDD可能会被重复计算?一般是宽依赖RDD, 即RDD的下游可能有多个, 但是另一个下游的拉去可能较慢, 那么此时需要做缓存。 cacheManager只是对RDD的管理, 真正的缓存以及获取是通过blockManager,然后根据内存情况选择存内存还是存磁盘。 RDD不是一定会做缓存,这取决于存储级别
>>阅读原文<<
相关文章
1.
【转】.Net缓存管理框架CacheManager
2.
磁盘管理
3.
linux磁盘存储管理
4.
spark rdd缓存及缓存清理
更多相关文章...
•
Eclipse 任务管理
-
Eclipse 教程
•
Swarm 集群管理
-
Docker教程
•
Docker 清理命令
•
Java Agent入门实战(三)-JVM Attach原理与使用
相关标签/搜索
内存管理
管理
地图管理
图书管理
盘管
存管
图书管理员
图书馆管理
工业管理和通常管理
Spark
MySQL教程
XLink 和 XPointer 教程
Redis教程
存储
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
js中 charCodeAt
2.
Android中通过ViewHelper.setTranslationY实现View移动控制(NineOldAndroids开源项目)
3.
【Android】日常记录:BottomNavigationView自定义样式,修改点击后图片
4.
maya 文件检查 ui和数据分离 (一)
5.
eclipse 修改项目的jdk版本
6.
Android InputMethod设置
7.
Simulink中Bus Selector出现很多? ? ?
8.
【Openfire笔记】启动Mac版Openfire时提示“系统偏好设置错误”
9.
AutoPLP在偏好标签中的生产与应用
10.
数据库关闭的四种方式
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
【转】.Net缓存管理框架CacheManager
2.
磁盘管理
3.
linux磁盘存储管理
4.
spark rdd缓存及缓存清理
>>更多相关文章<<