本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文连接,谢谢合做。html
文章是哥(mephisto)写的,SourceLinknode
上一篇,咱们使用Maven构建了个人MapReduce程序,而且成功的运行了Job。那么你们可能会以为为何要这么作,有没有些理论依据,毕竟对hadoop的功能,特色有了了解后,作事情会内心稍微有点底。因此咱们开始补些理论知识。服务器
下面,咱们就开始比较下Hadoop1.x与Hadoop2.x,感觉下产品迭代的快乐。架构
申明,这一篇幅的图都是网上找的,就不打水印了,作人得厚道。app
一:里程碑
2003-2004年 Doug Cutting和Mike Cafarella利用业余时间实现了HDFS和MapReduce机制。框架
2005年做为Lucene的子项目Nutch正式引入Apache基金会oop
2006年MapReduce,NDFS分别被归入Hadoop项目中spa
2010年发布0.20.2:security append日志
2011年12月0.20.线路发布1.0版本orm
2012年发布1.04
2011年10月份发布0.23.0:开始有了Yarn
2012年3月份发布2.0.0:alpha
2013年发布2.1.0:beta
2013年10月发布2.2.0:稳定版。很重要的版本,Yarn,High Availability for HDFS,HDFS Federation,HDFS Snapshots,Support for running Hadoop on Microsoft Windows
2014年11月发布2.6.0:很重要的版本,好比密钥管理服务器,凭证提供,支持SSD,热插拔DataNode,long running services in YARN,Support for rolling upgrades等。
2015年4月发布2.7.0:放弃了jdk1.6,不是稳定版,支持支持文件截断,Make YARN authorization pluggable等。
2015年7月发布2.7.1:2.7线路的稳定版。
2015年9月23号发布2.6.1:2.6线路的版本,修复了不少bug。
一:架构比较
Hadoop1.x中1的NameNodes只可能有一个,虽然能够经过SecondaryNameNode与NameNode进行数据同步备份,可是总会存在必定的时延,若是NameNode挂掉,可是若是有部份数据尚未同步到SecondaryNameNode上,仍是可能会存在着数据丢失的问题。
Hadoop2.x中,HDFS的变化,主要体如今加强了NameNode的水平扩展及可用性,能够同时部署多个NameNode,这些NameNodes之间是相互独立,也就是说他们不须要相互协调,DataNode同时在全部NameNodes注册,作为他们共有的存储节点,并向定时向全部的这些NameNodes发送心跳块使用状况的报告,并处理全部NameNodes向其发送的指令。
Hadoop2.x中将MapReduce分红两部门,造成了Yarn(云资源管理系统),从而扩展出不少新的玩法。
二:定位
从图中,咱们能够看到Hadoop1.x是单一功能使用系统,Hadoop2.x是多用途平台。2.x开始,hadoop的功能加强了许多,能够适合不少地方。
三:特性:
Hadoop1.x:批量应用
Hadoop2.x:批量应用,交互式,实时性,流式,内存计算。
四:HDFS与HDFS2
HDFS2多了高可用性。
五:MapReduce
Hadoop2.x中将原来1.x中的MapReduce的功能分开了,只保留了数据处理。将集群资源管理放到了Yarn中。从而让2.x的生态圈极大的扩展。
六:Hadoop2.x中HDFS架构
图中,咱们能够看到一个NameNode(Active)还有一个NameNode(Standby)。这二者中间有JournalNode,放镜像文件,编辑日志文件。使用Zookeeper来保证故障转移,从而实现HA。还具备联邦的功能,
七:Yarn架构图
Hadoop发展到了2.6.0,Yarn也有了HA。Yarn把Datanode和应用的执行状态都存在RMStateStore上面。从而具备long running services,Support for rolling upgrades。任务挂了就不用从新跑了。太牛的功能了。
八:生态应用
Hadoop1.x其余的生态应用都是基于MapReduce上面的,可是到了Hadoop2.x,他将资源管理的的放到了Yarn,那么其余的生态应用,能够基于MapReduce的计算框架,也能够选择Tez(DAG计算框架),Storm(流式计算框架)。因此使用范围大大的扩展开来。
--------------------------------------------------------------------
到此,本章节的内容讲述完毕。
本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文连接,谢谢合做。
文章是哥(mephisto)写的,SourceLink