JavaShuo
栏目
标签
spark-learn-01
时间 2021-01-12
标签
spark
栏目
Spark
繁體版
原文
原文链接
spark是基于内存计算的分布式大数据计算框架; spark执行特点 中间结果输出到内存,而非硬盘; 抽象出分布式内存存储结构RDD; RDD支持粗粒度写操作,同时对读操作,能细化到每条记录; 能控制数据在不同节点上的分区,即自定义分区策略; 不同stage之间会shuffle,shuffle是连接有依赖的stage的桥梁,上游stage输出到下游stage必须经过shuffle,shuffle将
>>阅读原文<<
相关文章
更多相关文章...
相关标签/搜索
Spark
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
gitlab4.0备份还原
2.
openstack
3.
深入探讨OSPF环路问题
4.
代码仓库-分支策略
5.
Admin-Framework(八)系统授权介绍
6.
Sketch教程|如何访问组件视图?
7.
问问自己,你真的会用防抖和节流么????
8.
[图]微软Office Access应用终于启用全新图标 Publisher已在路上
9.
微软准备淘汰 SHA-1
10.
微软准备淘汰 SHA-1
本站公众号
欢迎关注本站公众号,获取更多信息