大数据之HIVE

HIVE 1.概述 Hive时Apache提供的一套基于Hadoop的用于进行数据仓库操作的工具 Hive提供了类SQL语句来操作数据,在底层将SQL转化为MapReduce程序来执行,所以Hive的执行效率比较低,适合于离线分析。 每一个database,table会在HDFS上对应一个目录 Hive中没有主键 2.数据仓库 数据仓库的数据量>TB,数据库<=GB 数据种类和来源,数据仓库和来源
相关文章
相关标签/搜索