Hadoop概念学习系列之Hadoop新手学习指导之入门需知(二十)

       很少说,直接上干货!html

 

 

  零基础学习hadoop,没有想象的那么困难,也没有想象的那么容易。从一开始什么都不懂,到可以搭建集群,开发。整个过程,只要有Linux基础,虚拟机化和java基础,其实hadoop并无太大的困难。下面整理一下整个学习过程,给你们一个参考。java

    首先咱们要了解hadoop是什么?Hadoop可以作什么?Hadoop的使用场景是什么?Hadoop和大数据、云计算的关系是什么?如何使用hadoop?linux

     当你们对这些问题有了基本的了解以后,接下来咱们就要系统性的学习hadoop了。我我的建议你们不要一味的去学习理论知识,最好是理论和实践相结合,能够先跟着视频和文档去操做,先把伪分布式集群搭建起来,把wordcount实例运行起来,对hadoop集群的搭建过程和运行机制有个大概的了解和认知,而后从操做的过程当中去发现本身在哪方面是薄弱点,有针对性的去弥补,这样学习就会更有针对性和目的性,学习效果也相对会更好一些,不然学习会很盲目、很痛苦的。编程

    咱们知道hadoop有单机模式,伪分布模式和分布式模式。同时hadoop的环境是Linux,因此咱们还须要安装Linux系统。由于咱们的习惯是使用windows,因此对于Linux上来就安装软件之类的,困难程度会很大。而且咱们要搭建集群,须要多台硬件的,不可能为了搭建集群,去买三台电脑。因此从成本和使用的角度咱们还须要懂虚拟化方面的知识。这里的虚拟化其实就是咱们须要懂得虚拟机的使用。由于hadoop安装在Linux中,才能真正发挥做用。因此咱们也不会使用windows。windows

   

 

    基于以上内容。因此咱们须要懂得centos

1.虚拟化微信

2.Linux网络

3.java基础框架

 

 

下面咱们来详细介绍:运维

    虚拟化:咱们选择的是VMware Workstation,这里就要求咱们会搭建虚拟机,安装linux(如centos)操做系统,这方面只要按照视频操做应该仍是很简单的,难点在于虚拟机网络的配置,尤为是nat模式和bridge模式,由于hadoop要求主机与虚拟机与外部网络(能上网),这三者是相通的,都可以链接上网络,只有这样在安装的过程当中,才不会遇到麻烦。

     Linux对于Linux的学习也是一个过程,由于可能你连最简单的开机和关机命令都不会,更不要谈配置网络。经常使用的linux命令也就20多种,咱们须要作的就是在搭建集群的过程当中不断地增强练习,在实践中去记忆。可是咱们会遇到各类不会的命令,即便能查到命令,咱们也不能使用。为何会这样,由于有的命令,是须要使用安装包的。因此咱们也要学会如何下载安装包。

    咱们须要使用一些命令,进行网络配置,可是在网络配置中,这里面又必须懂得虚拟机的一些知识,因此前面的虚拟机知识须要掌握扎实一些。

    对于有linux基础的学员也能够选择hadoop运维工程师做为职业选择。

    提醒你们切忌浮躁,咱们不可能一两天就能完成上面的全部内容,咱们至少须要花费一周的时间不断地去训练、强化。只要咱们熟悉了Linux命令,熟悉了网络知识。后面咱们的学习才会很轻松,很快速。

   经过以上的学习咱们已经会安装集群了,那么接下来咱们就须要进入开发阶段。开发零基础,该怎么办呢?

    hadoop编程是一个Java框架,同时也是编程的一次革命,使得传统开发运行程序由单台客户端(单台电脑)转换为能够由多个客户端运行(多台机器)运行,使得任务得以分解,这大大提升了效率。

    hadoop既然是一个Java框架,所以就要求咱们必需要懂Java,网上有大量的资料,因此学习Java不是件难事。可是学到什么程度,多是咱们零基础同窗所关心的。

    Java:咱们须要具有javaSE基础知识,暂时不须要java Web及各类框架知识。若是没有javaSE基础,建议在学习hadoop以前或过程当中要增强这方面的学习和训练。固然有java基础和开发经验的学员学习hadoop就会更快速、更轻松。

     

 

Hadoop概念学习系列之Hadoop、Spark学习路线(很值得推荐)(十八)

 

 

 

 

欢迎你们,加入个人微信公众号:大数据躺过的坑        人工智能躺过的坑
 
 
 

同时,你们能够关注个人我的博客

   http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/   

   详情请见:http://www.cnblogs.com/zlslch/p/7473861.html

 

  人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和我的学习工做的精华干货知识,一切来于互联网,反馈回互联网。
  目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及日常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,天天必须有收获

 

      对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071) 

 

 

 

 

 

 

 

 

 

 

 

 

相关文章
相关标签/搜索