零基础如何转行大数据?系统学习路线在此

都知道大数据薪资高,前景好。而大数据又须要Java基础。对于稍微懂些Java的童鞋来讲,到底如何转行大数据呢?今天小编给你一个大数据工程师具体的学习路线图。【ps:无java基础也能够学习大数据】java

分享转行经验路线程序员

对于Java程序员,大数据的主流平台hadoop是基于Java开发的,因此Java程序员往大数据开发方向转行从语言环境上更为顺畅,另外不少基于大数据的应用框架也是Java的,因此在不少大数据项目里掌握Java语言是有必定优点的。算法

在这里仍是要推荐下我本身建的大数据学习交流群:529867072,群里都是学大数据开发的,若是你正在学习大数据 ,小编欢迎你加入,你们都是软件开发党,不按期分享干货(只有大数据软件开发相关的),包括我本身整理的一份最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深刻大数据的小伙伴加入。sql

固然,hadoop核心价值在于提供了分布式文件系统和分布式计算引擎,对于大部分公司而言,并不须要对这个引擎进行修改。这时候除了熟悉编程,你一般还须要学习数据处理和数据挖掘的一些知识。尤为是往数据挖掘工程师方向发展,则你须要掌握更多的算法相关的知识。数据库

对于数据挖掘工程师而言,虽然也须要掌握编程工具,但大部分状况下是把hadoop当作平台和工具,借助这个平台和工具提供的接口使用各类脚本语言进行数据处理和数据挖掘。编程

所以,若是你是往数据挖掘工程方向发展,那么,熟练掌握分布式编程语言如scala、spark-mllib等可能更为重要。网络

Java程序员转大数据工程师的学习路线图:框架

第一步:分布式计算框架运维

掌握hadoop和spark分布式计算框架,了解文件系统、消息队列和Nosql数据库,学习相关组件如hadoop、MR、spark、hive、hbase、redies、kafka等;编程语言

第二步:算法和工具

学习了解各类数据挖掘算法,如分类、聚类、关联规则、回归、决策树、神经网络等,熟练掌握一门数据挖掘编程工具:Python或者Scala。目前主流平台和框架已经提供了算法库,如hadoop上的Mahout和spark上的Mllib,你也能够从学习这些接口和脚本语言开始学习这些算法。

第三步:数学

补充数学知识:高数、几率论和线代

第四步:项目实践

1)开源项目:tensorflow:Google的开源库,已经有40000多个star,很是惊人,支持移动设备;

2)参加数据竞赛

3)经过企业实习获取项目经验

若是你仅仅是作大数据开发和运维,则能够跳过第二步和第三步,若是你是侧重于应用已有算法进行数据挖掘,那么第三步也能够先跳过。

相关文章
相关标签/搜索