大数据教程（11.5）仓库工具hive的实现机制

时间 2019-11-06

标签数据教程 11.5 仓库工具 hive 实现机制栏目 Hadoop 繁體版

原文原文链接

上一篇文章介绍了hadoop联邦集群的搭建过程。至此，hadoop的整个知识系统就差很少结束了。本篇博客开始，博主将分享数据仓库hive工具的原理以及使用。数据库

1、Hive基本概念服务器

(1)什么是Hive函数

Hive是基于Hadoop的一个数据仓库工具，能够将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。工具

(2)为何使用Hiveoop

直接使用hadoop所面临的问题：a.人员学习成本过高 b.项目周期要求过短 c.MapReduce实现复杂查询逻辑开发难度太大【这一点相信你们在以前的博客中作hadoop的join操做时就已经能体会到了】
使用Hive的好处：操做接口采用类SQL语法，提供快速开发的能力。避免了去写MapReduce，减小开发人员的学习成本。扩展功能很方便。学习

(3)Hive的特色大数据

可扩展：Hive能够自由的扩展集群的规模，通常状况下不须要重启服务。blog

延展性：Hive支持用户自定义函数，用户能够根据本身的需求来实现本身的函数。接口

容错：良好的容错性，节点出现问题SQL仍可完成执行。hadoop

2、Hive的使用场景

3、Hive的使用原理

最后寄语，以上是博主本次文章的所有内容，若是你们以为博主的文章还不错，请点赞；若是您对博主其它服务器大数据技术或者博主本人感兴趣，请关注博主博客，而且欢迎随时跟博主沟通交流。