Spark RDD编程指南(官网翻译)

概观 与Spark连接 初始化Spark 使用Shell 弹性分布式数据集(RDD) 并行化集合 外部数据集 RDD操做 基本 将函数传递给Spark 了解关闭 例 本地或群集模式 打印RDD的元素 使用键值对 转换 操做 洗牌操做 背景 性能影响 RDD持久性 选择哪一个存储级别? 删除数据 共享变量 广播变量 蓄电池 部署到群集 从Java / Scala启动Spark做业 单元测试 从这往哪
相关文章
相关标签/搜索