转自:https://www.cnblogs.com/zlslch/p/5448857.htmlhtml
很少说,直接上干货!java
说在前面的话mysql
此笔,对于仅对于Hadoop和Spark初中学者。高手请忽略!linux
1 Java基础:web
视频方面:
推荐《毕向东JAVA基础视频教程》。学习hadoop不须要过分的深刻,java学习到javase,在Java虚拟机的内存管理、以及多线程、线程池、设计模式、并行化多多理解实践便可。面试
书籍方面:redis
推荐李兴华的《java开发实战经典》sql
2 Linux基础:数据库
视频方面:编程
(1)马哥的高薪Linux视频课程-Linux入门、
(2)兄弟连的新版Linux视频教程、
(3)老段的讲解鸟哥Linux基础+私房菜、
(4)老男孩的Linux。
看的过程当中,不可只看不一样步操做,这是最危险的一件事!不需所有看完。如:基本的Linux操做系统官网下载、安装(命令行界面和图形界面)、基本命令、网络配置、快照、VM tools工具安装、虚拟机的菜单熟悉等等。这是必需要首先完成的。以后,可回过来再根据须要使用到哪些,再来学习便可。看成工具书!
书籍方面:
(1)《鸟哥的linux私房菜》,
(2)以后,进一步能够看书籍《鸟哥的服务架设篇》。
(3)Linux随身指南
(4)老男孩Linux运维
系统学习只要多多实践,学习linux并不枯燥。
3 hadoop书籍:
(1)《Hadoop实战 (第1版) 陆嘉恒》、《Hadoop实战 (第2版) 陆嘉恒》
(2) 《hadoop definitive guide 》,
中文书名是《Hadoop权威指南 (第1版)曾大聃译》,《Hadoop权威指南 (第2版) 周敏奇译》,《Hadoop权威指南 (第3版 ) 华东师范大学数据科学与工程学院译》,固然如今应该是第4版了。
(3)Hadoop技术内幕:《深刻解析Hadoop common和HDFS架构设计与实现原理》 蔡斌
(4)hadoop技术内幕:《深刻解析YARN架构设计与实现原理》董西成
(5)Hadoop技术内幕:《深刻理解MapReduce架构设计与实现原理》 董西成
(5)《Hadoop in Action》,
中文书名是《Hadoop实战》,
(6) 《Hadoop应用开发技术详解 刘刚》
(7)《Hadoop 核心技术》 翟周伟
日常多看看hadoop的官网,虽然是官网,但尽可能多学习计算机方面的单词,对后续学习帮助极大。
日常多看看他人的博客和社区论坛。
日常多总结和作好笔记,及时回过头来再次屡次整理。
4 Maven书籍:
强烈推荐书籍:Maven实战 许晓斌著。目前是初版
五、spark书籍:
(1)《Spark大数据处理 技术、应用与性能优化 高彦杰》
(2)《深刻理解Spark核心思想与源码分析 耿嘉安》
(3)《图解Spark:核心技术与案例实战》
摘要: 致目前想要学习大数据,可是却不了解大数据,也不知道该从哪开始学起的同窗,但愿这篇文章可以帮到大家。
最近群里有不少朋友问我,"初学大数据,不知道怎么开始学","不知道大数据具体是什么东西,只是据说很厉害的样子","学习大数据,须要学习哪些框架,只学习spark能够吗?" 等等...相似的问题,针对这些问题,一两句话解释不清楚,因此,就在这里写一些我本身的见解吧,但愿能够帮助到初学者的你。
大数据初学者,总结下来,大体有这么几种状况:
上面这几种状况的同窗都有一个共性,对大数据都是0基础,相对而言,有软件开发经验的老司机学习起来不会很吃力,其他的刚开始学起来会比较吃力,但只要肯比别人多花点时间,多下点功夫,其实并无你想象的那么难。有付出,才会有回报!
好了,废话很少说了,下面就直接说一下,针对全部大数据初学者的一些学习建议吧【适用于上面三种基础的同窗】
有不少朋友问过我,大数据究竟是什么?一句话来归纳
1. linux基础是必须的,最起码须要掌握linux命令行下的基本操做命令
2. javase基础【包含mysql】,注意是javase,不是javaee。javaweb那一块的知识针对大数据工程师而言不是必须的
下面有一张图,大体列出来了大数据生态圈周边的一些技术框架[不够全面,仅供参考]
其实这张图中主要列出来了hadoop生态圈的框架,后期有时间的话从新整理一份完整的 。
这个图中列出来了不少框架,其实,学习大数据,就是要学习大数据生态圈周边的各类框架。
上面虽然列出来了不少框架,可是最开始学习的时候不必所有都学,就算是在工做中,这些框架也不必定会所有用到。
下面我就大体列一下,各类框架的一个学习步骤吧:
注意:下面列出来的顺序只是我的建议,能够根据我的实际状况来调整顺序
目前暂且列出来这么多吧,大数据生态圈目前还有不少比较好的技术框架,这个就须要等你们之后工做以后再去扩展了。
其实上面列出来的这十几个框架,在学习的时候,要专门挑一两个着重研究一下,最好针对,底层原理,优化,源码等部分有所涉猎,这么的话能够在面试过程当中脱颖而出。不要想着把每个框架都搞精通,目前是不现实的,其实就算是在工做中也不会每个框架都会用的很深。
若是能过对上面的框架都大体会使用,而且对某一两个框架研究的比较深的话,其实想去找一份满意的大数据工做也就水到渠成了。
上面说的这么多,是根据博主最近几年的一些经验总结吧,若是你们有什么观点能够在下面留言讨论。
最终,你们仍是要落于找项目来提高本身,必需要有作项目的经验。如今互联网时代,别跟我说,找不到学习的资源。谷歌百度你懂的... !!!
其实,说白了,你们仍是要在入门以后,有了必定经验,更多仍是要去看官网。这是最重要!包括动手去实践,多敲命令!
福利: 欢迎你们,加入我建立的公益技术交流群 和 我的微信公众号 ,必须免费!
同时,你们能够关注个人我的博客:
http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/ http://www.cnblogs.com/sunnyDream/
详情请见:http://www.cnblogs.com/zlslch/p/7473861.html
人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和我的学习工做的精华干货知识,一切来于互联网,反馈回互联网。
目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及日常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,天天必须有收获
对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071)
做者:大数据和人工智能躺过的坑
出处:http://www.cnblogs.com/zlslch/ 本文版权归做者和博客园共有,欢迎转载,但未经做者赞成必须保留此段声明,且在文章页面明显位置给出原文连接,不然保留追究法律责任的权利。 若是您认为这篇文章还不错或者有所收获,您能够经过右边的“打赏”功能 打赏我一杯咖啡【物质支持】,也能够点击右下角的【好文要顶】按钮【精神支持】,由于这两种支持都是我继续写做,分享的最大动力!