hadoop生态的大致介绍

  重点组件: HDFS:Hadoop 的分布式文件存储系统 MapReduce:Hadoop 的分布式程序运算框架,也能够叫作一种编程模型 Hive:基于 Hadoop 的类 SQL 数据仓库工具 HBase:基于 Hadoop 的列式分布式 NoSQL 数据库 ZooKeeper:分布式协调服务组件 Mahout:基于 MapReduce/Flink/Spark 等分布式运算框架的机器学习算法
相关文章
相关标签/搜索