Hive

Hive是什么? 由facebook开源的用于解决海量结构化日志的数据统计,后称Apache Hive 的开源项目。 Hive是基于Hadoop文件系统上的数据仓库架构。存储用HDFS,计算用MR。它为数据仓库管理提供大量功能,如数据ETL(详细看前文)工具,数据存储管理与大型数据查询和分析能力。 同时Hive还定义了类SQL语言--Hive QL,允许用户进行和SQL相似的操作。他可以将结构化数
相关文章
相关标签/搜索