数据仓库工具之hive介绍

Hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。本质是将SQL转换为MapReduce程序。 hive的主要用途:用来做离线数据分析,比直接用MapReduce程序开发效率更高。 直接使用MapReduce所面临的问题: 人员学习成本太高:使用mr直接分析数据的前提是需要开发复杂的mapreduce程序,这对于数据仓库的受众群体来说,
相关文章
相关标签/搜索