《spark设计与实现》(许利杰)--读书笔记

除了主要介绍spark,还有一些跟mapreduce对比的内容。 文章目录 1 大数据处理框架概览 1.1 大数据处理框架的四层结构 1.1.1 用户层:数据输入、用户代码、配置参数 1.1.2 分布式数据并行处理层 1.1.3 资源管理与任务调度层 1.1.4 物理执行层 2 spark逻辑处理流程 2.1 组成 2.1.1 数据源(data blocks) 2.1.2 数据模型 2.1.3 数
相关文章
相关标签/搜索