hadoop学习笔记

分布式存储&分布式计算 搭建大型数据仓库,PB级数据的存储、处理、分析、统计等任务 优势:高扩展、低成本(用普通的PC机)、成熟的生态圈(工具集) 工具集: HIVE:SQL语句转为hadoop任务 HBASE:随机读写 ZOOKEEPER:监控集群 HDFS:分布式文件系统,存储海量数据 MapReduce:并行处理的框架,实现任务分解和调度 NameNode:管理节点,存放文件的元数据(文件与
相关文章
相关标签/搜索