Hadoop 基础架构 详解

一.Hadoop简介 Hadoop是Apache基金会下一个分布式大数据开发平台,以Map-Reduce 的高效,支持快速检索著称,与其齐名是Spark分布式大数据开发平台。 其生态包括: Common:一系列组件和接口,用于分布式文件系统和通用I/O(序列化,JavaRPC和持久化数据结构) Avro:一种序列化系统,用于支持高效、跨语言的RPC和持久化数据存储 MapReduce:分布式数据处
相关文章
相关标签/搜索