记得刚接触到hadoop的时候跟大部分人同样都会抱怨hadoop的安装部署问题,对于一个新手来讲这这的是个头疼的问题,可能须要花费一成天的时间才能把分布式环境安装配置好。在刚接触hadoop的一段时间里,能够说对于hadoop的理解一直都是停留在相对较肤浅的层面。后来随着本身的不断摸索以及向圈内的前辈大神请教交流(主要是向大神请教学来的),本身对于hadoop的认识以及应用也就更加娴熟。安全
做为一个过来人,在这里给新人分享一些关于hadoop版本选择的问题,但愿别像我当时傻乎乎的只知道hadoop有1.0.x和2.x版本。运维
当前hadoop的发行版本除了Apache的开元版本以外,华为发行版、Intel发行版以及Cloudera发行版等。上面说的这几个第三方的发行版已经有相对较长的一些时间,除此以外还有最近几年异军突起的DKhadoop商业发行版。分布式
国内的大多数公司推出的Hadoop发行版都是收费的,免费的发行版则主要是国外的,好比Apache的发行版、Cloudera发行版等。面对如此多的hadoop版本难免会让人难以选择。下面咱们就简单对比一些这些不一样版本的优缺点,但愿对于新手可以有所帮助。工具
Apache发行版:oop
优势:Apache发行版的优势主要集中表如今它的彻底开源免费、社区活跃性以及文档、资料详实等方面。性能
缺点:Apache发行版的缺点也相对较多,具体表如今如下几个方面:spa
第三方发行版本的优缺点:(如CDH,HDP,MapR等)3d
优势:第三方发行版本的优势主要有如下几个:blog
缺点:第三方hadoop发行版的主要缺点就是涉及到厂商锁定的问题,但这一问题能够经过技术方面解决掉。hadoop
DKhadoop发行版:
Dkhadoop发行版是我目前接触的以及使用一个版本。与市场的其余第三方的发行版本相比较,整合程度要更高,但一样也保持了开源系统的所有优势。综合目前使用的状况看,在性能上相较于以往使用的一些第三方hadoop发行版要提高不少的!关于DKhadoop发行版的问题,感兴趣的能够本身去查阅收集一些资料看看。