HADOOP生态圈

Hadoop是一个开源的、可靠的、可扩展的分布式并行计算框架 主要包括: -MapReduce – 离线大数据分析计算引擎 -HDFS – 分布式文件系统:大规模、分布式、容错 -YARN – 任务执行调度资源管理框架 -Hbase – NoSQL数据库 -Hive – 分布式数据仓库:基于SQL的数据仓库,数据分析工具,将结构化数据文件映射为库表,并提供强大的类SQL查询功能 -MapReduc
相关文章
相关标签/搜索