Hive 基础入门

时间 2019-11-12

标签 hive 基础入门栏目 Hadoop 繁體版

原文原文链接

Hive的官方网站：数据库

Hive简介：架构

　　　　　　Hive 是基于Hadoop 的一个数据仓库工具，能够将结构化的数据文件映射成一张表，并提供类SQL查询功能。函数

　　　　　　Hive在企业中做为一种工做，能够很容易的对数据进行ETL。工具

　　　　　　Hive能够对各类各样的数据进行一种结构化的查询。（按照必定结构进行查询）。oop

　　　　　　Hive 处理的数据都是存在 HDFS 之上，而且可以与 HBase 进行集成。学习

　　　　　　分析数据底层的实现都是 MapReduce ，运行都是运行在 yarn 上边。大数据

Hive的用途：　　网站

　　　　　　数据的查询、数据的管理。spa

ETL简介：

　　　　　　E : 提取数据

　　　　　　T：转换数据

　　　　　　L：加载数据

HQL：

　　　　　　HQL 就是 Hive 查询使用的语句。

Hive本质 :

　　　　　　就是将 HQL 语句转化为 MapReduce 。

Hive 和 Hadoop 之间的关联：

　　　　　　都是使用 HDFS 进行数据存储。

　　　　　　都是使用 yarn 进行资源管理。

　　　　　　都是使用 MapReduce 进行数据处理。

Hive的执行方式：

　　　　　　Hive 就是将数据映射成一个关系型数据库（RDBMS）的表。而执行方式就是 SQL 语句。

　　　　　　执行SQL语句，底层就会自动的将语句翻译为MapReduce程序，提交给 YARN 去执行。

Hive 在 Hadoop 生态系统中的地位：

Hive 的架构：

Hive的优势及使用场景