Hadoop数据管理

这一批博文是博主由博客园搬移过来的,所以时间上可能存在混乱,希望大家见谅!   本节主要从三方面介绍Hadoop数据管理:分布式文件系统HDFS、分部式数据库HBase和数据仓库工具Hive。 1. HDFS的数据管理   HDFS是分布式计算的存储基石,Hadoop分布式文件系统和其他分布式文件系统由很多类似的特性:   1)对于整个集群有单一的命名空间;   2)具有数据一致性,都适合一次写入
相关文章
相关标签/搜索