压抑了这么久了,是时候来一啵活动了。
为了感谢朋友们一直以来的支持,今天米兜获得一位既是主编也是粉丝的支持,将赠送来自这位朋友编写的一本书籍《Hive数据仓库企业级应用》。此书真心推荐朋友们阅读。数据库
本次赠书活动规则:
移动互联、电子商务、社交网络大大拓展了互联网的疆界和应用领域,咱们正处在一个数据爆炸性增加的时代,大量的数据对人类的数据驾驭能力提出了新的挑战和机遇。就在这时,人们提出了大数据的思想,大数据是指那些超过传统数据库系统处理能力的数据。其数据规模和传输速度要求很高,或者其结构不适合本来的数据库系统。可是咱们为了获得它其中的价值,就不得不使用一些技术手段去处理它。大数据分析常和云计算联系在一块儿,由于实时的大型数据集分析须要MapReduce同样的计算框架来向不一样机架,甚至是不一样数据中心中的电脑分配工做。正是因为Hadoop中的MR框架才可让人们处理TB级的数据。微信
正如上面的漫画,因为MapReduce框架只有专业的开发人员才可使用,SQL的人就没办法去使用该框架处理一些数据,所以人们发明了Hive的组件,Hive也是Apache的顶级项目,它底层的计算引擎是MR(离线计算框架)或者是Tez(基于Hadoop YARN之上的DAG计算框架),人们可使用简单的类SQL语句就能够跑出MR程序,从而来完成复杂的数据处理工做,Hive让更多的人能够去处理大数据,而且让这份复杂的工做再也不成为很困难的事情。Hive是一种底层封装了Hadoop的数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询,全部Hive的数据都存储在Hadoop兼容的文件系统(例如,Amazon S三、HDFS)中。Hive在加载数据过程当中不会对数据进行任何的修改,只是将数据迁移到HDFS设定的目录下。Hive的设计特色以下,网络
最后,介绍一下小编最近写的一本书,叫《Hive数据仓库企业级应用》。架构
在介绍这本书以前,首先跟你们分享一下小编写这本书的原因。我也不知道是一个多么幸运的机会,让小牛和电子社的老师找到我。答应写书以后,已经数不清多少个夜晚在加班以后回去和周末还要继续创做,在我写这本书的过程中,我深深体会到了本身的想法仍是受言语和表达的束缚。在坚持了一年多的时间里,电子版校对和纸质版的校对不可胜数,曾经由于内容以及表达的问题,被返稿了屡次,也一度想要放弃,可是我相信坚持下去就会获得想要的结果。就在历时大概快两年的时间以后,这本书总算接近了尾声,看到了本身想要的结果。框架
说了这么多,咱们来看一下这本书的内容,本书主要的出发点是为了让更多的人去学会Hive,将实战与原理相结合。从最基础的语法讲起,
实战方面共分为了24章去讲解,从最基础的HQL语法到HQL优化,以及最后的案例实战,整个过程都是含有实战性代码以及运行结果。机器学习
原理部分的关键是最后的Hive的源码剖析,让广大读者能够跟随小编去了解Hive的运行机理,方便咱们更深刻的了解Hive的运行机制。更加剧要的是,咱们能够从中了解到某一个组件之因此这么被看好,它的奥妙所在。分布式
全书大体包含的内容以下:函数
-------------------------------------------------Hive介绍篇--------------------------------------工具
-------------------------------------------------Hive入门篇--------------------------------------oop
-------------------------------------------------Hive进阶篇-------------------------------------
-------------------------------------------------Hive强化篇--------------------------------------
-------------------------------------------------Hive实战篇--------------------------------------
-----------------------------------------------Hive源码剖析篇---------------------------------
创新点:源码部分从读取源码时候的环境搭建,而后每一步的函数调用,会跟随小编的思路,浏览遍Hive的源码。实战部分根据几个企业级的真实数据以及真实场景去作的整个项目,能够跟随小编了解到企业中Hive的应用场景是怎么样的。
适读人群:主要偏向于想要了解源码、想要学习企业中开发的流程、对大数据感兴趣而且想要学习的人。
最后,《Hive数据仓库企业级应用》是小编要上的一本书,感兴趣的朋友能够进行关注。
专一于大数据、机器学习、云计算方面的研究,感兴趣的小伙伴能够扫码交流,一块儿组建技术交流群,本书出版以后,将会逐一邮寄给幸运的朋友。如下是做者我的微信和技术交流群,欢迎你们踊跃加入。
技术交流群 | 做者我的微信 |
---|---|
![]() |
![]() |
@END
欢迎关注米兜Java,一个注在共享、交流的Java学习平台。