Hadoop基本理论

1、什么是Hadoop? Hadoop是一个分布式系统。主要包含两个核心组件HDFS和MR。 HDFS: 分布式存储系统,解决海量数据的存储问题。 MR:分布式计算框架,解决海量数据的处理问题。 在基础的HDFS和MR基础上,Hadoop生态圈又加入了其它的组件:     Habse 非关系型的分布式数据库,     Hive基于HDFS的数据仓库,     Pig  一个基于MR的大数据分析平台
相关文章
相关标签/搜索