《Hadoop大数据技术开发实战》新书上线

 

 

 

 

 

 当今互联网已进入大数据时代,大数据技术已普遍应用于金融、医疗、教育、电信、政府等领域。各行各业天天都在产生大量的数据,数据计量单位已从B、KB、MB、GB、TB发展到PB、EB、ZB、YB甚至BB、NB、DB。预计将来几年,全球数据将呈爆炸式增加。谷歌、阿里巴巴、百度、京东等互联网公司都急需掌握大数据技术的人才,而大数据相关人才却出现了供不该求的情况。html

 Hadoop做为大数据生态系统中的核心框架,专为离线和大规模数据处理而设计。Hadoop的核心组成HDFS为海量数据提供了分布式存储;MapReduce则为海量数据提供了分布式计算。不少互联网公司都使用Hadoop来实现公司的核心业务,例如华为的云计算平台、淘宝的推荐系统等,只要和海量数据相关的领域都有Hadoop的身影。编程

 本书做为Hadoop及其周边框架的入门书,知识面比较广,涵盖了当前整个Hadoop生态系统主流的大数据开发技术。内容全面,代码可读性强,以实操为主,理论为辅,一步一步手把手对经常使用的离线计算以及实时计算等系统进行了深刻讲解。架构

 全书共16章,第1章讲解了VMware中CentOS 7操做系统的安装;第2章讲解了大数据开发以前对操做系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括经常使用的Shell命令、API操做、源码剖析,并经过实际案例加深对各个框架的理解与应用。框架

那么如何学习本书呢?分布式

 本书推荐的阅读方式是按照章节顺序从头至尾完成阅读,由于后面的不少章节是之前面的章节为基础,并且这种一步一个脚印、由浅入深的方式将使你更加顺利地掌握大数据的开发技能。oop

学习本书时,首先根据第一、2章搭建好开发环境,而后依次学习第3~16章,学习每一章时先了解该章的基础知识和框架的架构原理,而后再进行集群环境搭建、Shell命令操做等实操练习,这样学习效果会更好。当书中的理论和实操知识都掌握后,能够进行触类旁通,本身开发一个大数据程序,或者将所学知识运用到本身的编程项目上,也能够到各类在线论坛与其余大数据爱好者进行讨论,互帮互助。学习

 本书可做为Hadoop新手入门的指导书籍或者大数据开发人员的参考用书,要求读者具有必定的Java语言基础和Linux系统基础,即便没有任何大数据基础的读者,也能够对照书中的步骤成功搭建属于本身的大数据集群,是一本真正的提升读者动手能力、以实操为主的入门书籍。经过对本书的学习,读者可以对大数据相关框架迅速理解并掌握,能够熟练使用Hadoop集成环境进行大数据项目的开发。大数据

 

京东购买连接:云计算

https://item.jd.com/12576717.html操作系统

 

当当购买连接:

http://product.dangdang.com/27941792.html

相关文章
相关标签/搜索