Hive的架构与搭建

什么是Hive Hive是Hadoop生态圈中的一个数据仓库工具,也可以是一个数据分析引擎。他没有提供数据存储功能,基于HDFS,数据存储在HDFS上。HIve可以将结构化的数据映射为一张表,提供HQL语句查询的功能,所以需要依赖一个外部的数据库,这个数据库中之存储表的元信息,不存储任何实际的数据,数据还是在HDFS上。 Hive的核心是把HQL语句翻译成MR程序交给Yarn集群来调用。 hive
相关文章
相关标签/搜索