大数据--hive学习笔记

1、Hive简介 创建在Hadoop之上的数据仓库架构 hive的设计目标:可伸缩、可扩展、容错及输入格式松耦合! 一套方便的实施数据抽取(ETL)的工具。 一种让用户对数据描述其结构的机制。 支持用户对存储在Hadoop中的海量数据进行查询和分析的能力。 特性 使用HDFS做为数据存储 经过Map Reduce完成数据运算 提供相似SQL的语言(HQL) HQL灵活的可扩展性(UDF、UDAF、
相关文章
相关标签/搜索