上一篇文章介绍了hadoop联邦集群的搭建过程。至此,hadoop的整个知识系统就差很少结束了。本篇博客开始,博主将分享数据仓库hive工具的原理以及使用。数据库
1、Hive基本概念服务器
(1)什么是Hive函数
Hive是基于Hadoop的一个数据仓库工具,能够将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。工具
(2)为何使用Hiveoop
直接使用hadoop所面临的问题 :a.人员学习成本过高 b.项目周期要求过短 c.MapReduce实现复杂查询逻辑开发难度太大【这一点相信你们在以前的博客中作hadoop的join操做时就已经能体会到了】
使用Hive的好处:操做接口采用类SQL语法,提供快速开发的能力。 避免了去写MapReduce,减小开发人员的学习成本。 扩展功能很方便。学习
(3)Hive的特色大数据
可扩展:Hive能够自由的扩展集群的规模,通常状况下不须要重启服务。blog
延展性:Hive支持用户自定义函数,用户能够根据本身的需求来实现本身的函数。接口
容错:良好的容错性,节点出现问题SQL仍可完成执行。hadoop
2、Hive的使用场景
3、Hive的使用原理
最后寄语,以上是博主本次文章的所有内容,若是你们以为博主的文章还不错,请点赞;若是您对博主其它服务器大数据技术或者博主本人感兴趣,请关注博主博客,而且欢迎随时跟博主沟通交流。