Hive介绍

1.简介 Hive是基于Hadoop的一个开源数据仓库工具,将海量结构化数据文件映射为一张表,并在其上提供类SQL(HQL)查询功能。Hive本质是将HQL转化成MapReduce,以处理存储在HDFS上的数据。 优点 避免写MapReduce,减少学习成本。提供HQL操作接口,易上手。 适合处理大数据,处理小数据意义不大。 支持自定义函数处理数据。 缺点 HQL表达能力有限。 执行效率低。基于M
相关文章
相关标签/搜索