大数据教程(11.5)仓库工具hive的实现机制

               上一篇文章介绍了hadoop联邦集群的搭建过程。至此,hadoop的整个知识系统就差很少结束了。本篇博客开始,博主将分享数据仓库hive工具的原理以及使用。数据库

        1、Hive基本概念服务器

               (1)什么是Hive函数

                   Hive是基于Hadoop的一个数据仓库工具,能够将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。工具

               (2)为何使用Hiveoop

                   直接使用hadoop所面临的问题 :a.人员学习成本过高 b.项目周期要求过短 c.MapReduce实现复杂查询逻辑开发难度太大【这一点相信你们在以前的博客中作hadoop的join操做时就已经能体会到了】
                   使用Hive的好处:操做接口采用类SQL语法,提供快速开发的能力。 避免了去写MapReduce,减小开发人员的学习成本。 扩展功能很方便。学习

               (3)Hive的特色大数据

                   可扩展:Hive能够自由的扩展集群的规模,通常状况下不须要重启服务。blog

                   延展性:Hive支持用户自定义函数,用户能够根据本身的需求来实现本身的函数。接口

                   容错:良好的容错性,节点出现问题SQL仍可完成执行。hadoop

        2、Hive的使用场景

        3、Hive的使用原理

          最后寄语,以上是博主本次文章的所有内容,若是你们以为博主的文章还不错,请点赞;若是您对博主其它服务器大数据技术或者博主本人感兴趣,请关注博主博客,而且欢迎随时跟博主沟通交流。

相关文章
相关标签/搜索