好程序员大数据教程分享之Hadoop优缺点

好程序员大数据教程分享之Hadoop优缺点,大数据成为时代主流,开启时代的大门,全球43亿部电话、20亿位互联网用户每秒都在不断地产生大量数据,人们发送短信给朋友、上传视频、用手机拍照、更新社交网站的信息、转发微博、点击广告等,使得机器产生和保留了愈来愈多的数据。咱们被数据所包围,咱们源源不断地制造新的数据。数据指数级地增加,对于各大互联网公司提出了新得挑战!程序员

咱们须要对TB级别和PB级别的数据进行分析处理,以发现哪些网站更受欢迎,哪些商品更具备吸引力,哪些广告更吸引用户。传统的工具对于处理如此规模的数据集愈来愈无能为力。而Hadoop的出现将弥补这一技术空白。框架

咱们说Hadoop应运而生,有了它,庞大的信息流有了新的处理平台。它被咱们誉为神奇的存在,帮助咱们在挑战中制造新的机遇!简要分享Hadoop优缺点,方便你们学习和分享!分布式

一、Hadoop的优势工具

  (1)Hadoop具备按位存储和处理数据能力的高可靠性。oop

  (2)Hadoop经过可用的计算机集群分配数据,完成存储和计算任务,这些集群能够方便地扩展到数以千计的节点中,具备高扩展性。学习

  (3)Hadoop可以在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度很是快,具备高效性。大数据

  (4)Hadoop可以自动保存数据的多个副本,而且可以自动将失败的任务从新分配,具备高容错性。网站

  二、Hadoop的缺点spa

  (1)Hadoop不适用于低延迟数据访问。视频

  (2)Hadoop不能高效存储大量小文件。

  (3)Hadoop不支持多用户写入并任意修改文件。

  Hadoop的核心组件

  三、Hadoop版本简介:

  Hadoop自诞生以来,主要出现了Hadoop一、Hadoop二、Hadoop3三个系列多个版本。

  HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的不少组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1以后出现了Hadoop2,Hadoop2在Hadoop1的基础上作了改进。相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2。

  Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介以下:

  (1)Hadoop Common:为其余Hadoop模块提供基础设施。

  (2)HDFS:具备高可靠性、高吞吐量的分布式文件系统。

  (3)MapReduce:基于Yarn系统,分布式离线并行计算框架。

(4)Yarn:负责做业调度与集群资源管理的框架。

相关文章
相关标签/搜索