大数据:Hadoop(简介)

一、简介 定义:开源的,做分布式存储与分布式计算的平台; 功能:搭建大型数据仓库,对PB级数据进行存储、处理、分析、统计等业务;(如日志分析、数据挖掘) Hadoop工作模块 Common:提供框架和工具,对其它Hadoop模块的支持; Distributed File System(HDFS:分布式文件系统):负责数据的存储; YARN:作业的调度及资源管理; MapReduce:基于YARN的
相关文章
相关标签/搜索