Spark系列一: 介绍及入门

一、Spark 是什么 spark是一个用来实现快速而通用的集群计算平台。 spark各组件: 1. Spark core实现了spark的基本功能,包括任务调度,内存管理,错误恢复,与存储系统交互等模块。 spark core中还包含了对弹性分布式数据集(resilient distributed dataset,RDD)对API定义。 RDD表示分布在多个计算节点上可以并行操作对原属集合,是s
相关文章
相关标签/搜索