一.大数据方向工做介绍
二.大数据工程师的技能要求
三.大数据学习路径
四.学习资源推荐(书籍、博客、网站)git
一.大数据方向工做介绍github
大数据方向的工做目前分为三个主要方向:
01.大数据工程师
02.数据分析师
03.大数据科学家
04.其余(数据挖掘本质算是机器学习,不过和数据相关,也能够理解为大数据的一个方向吧)
算法
二.大数据工程师的技能要求sql
附上二份比较权威的大数据工程师技能图(图侵删)微信
<img data-rawheight="1058" src="https://pic3.zhimg.com/50/v2-2712bddb7af89f1955333486b828271e_hd.jpg" data-rawwidth="720" class="origin_image zh-lightbox-thumb" width="720" data-original="https://pic3.zhimg.com/v2-2712bddb7af89f1955333486b828271e_r.jpg"/>
<img data-rawheight="1058" src="https://pic2.zhimg.com/50/v2-4ab509dd652081d2963cf9cf2a571665_hd.jpg" data-rawwidth="720" class="origin_image zh-lightbox-thumb" width="720" data-original="https://pic2.zhimg.com/v2-4ab509dd652081d2963cf9cf2a571665_r.jpg"/>
总结以下:架构
必须技能10条:
01.Java高级(虚拟机、并发)
02.Linux 基本操做
03.Hadoop(此处为侠义概念单指HDFS+MapReduce+Yarn )
04.HBase(JavaAPI操做+Phoenix )
05.Hive(Hql基本操做和原理理解)
06.Kafka
07.Storm
08.Scala须要
09.Python
10.Spark (Core+sparksql+Spark streaming )
11.一些小工具(Sqoop等)并发
高阶技能6条:
11.机器学习算法以及mahout库加MLlib
12.R语言
13.Lambda 架构
14.Kappa架构
15.Kylin
16.Aluxio
app
三.学习路径机器学习
因为本人是从Java开发经过大概3个月的自学转到大数据开发的。因此我主要分享一下本身的学习路劲。
ide
第一阶段:
01.Linux学习(跟鸟哥学就ok了)
02.Java 高级学习(《深刻理解Java虚拟机》、《Java高并发实战》)
第二阶段:
03.Hadoop (董西成的书)
04.HBase(《HBase权威指南》)
05.Hive(《Hive开发指南》)
06.Scala(《快学Scala》)
07.Spark (《Spark 快速大数据分析》)
08.Python (跟着廖雪峰的博客学习就ok了)
第三阶段:
对应技能需求,到网上多搜集一些资料就ok了,我把最重要的事情(要学什么告诉你了),
剩下的就是你去搜集对应的资料学习就ok了
固然若是你以为本身看书效率太慢,你能够网上搜集一些课程,跟着课程走也OK 。这个彻底根据本身状况决定。若是看书效率不高就很网课,相反的话就本身看书。
四.学习资源推荐:
01.Apache 官网
02.Stackoverflow
04.github
03.Cloudra官网
04.Databrick官网
05.大数据学习1 (微信公众号)
06.CSDN,51CTO
07.至于书籍当当一搜会有不少,其实内容都差很少。
最后但却很重要一点:要多关注技术动向,持续学习。