【大数据笔记01】Hadoop生态圈

前言 HDFS:分布式文件系统 MAPREDUCE:分布式运算程序开发框架 HIVE:基于 HADOOP 的分布式数据仓库,提供基于 SQL 的查询数据操作 HBASE:基于 HADOOP 的分布式海量数据库 ZOOKEEPER:分布式协调服务基础组件 Mahout:基于 mapreduce/spark/flink 等分布式运算框架的机器学习算法库 Oozie:工作流调度框架 Sqoop:数据导入
相关文章
相关标签/搜索