Java转行大数据该怎么规划学习

  Java转行大数据该怎么规划学习,学习过Java以后在学习大数据相对会轻松一些,主要是要分清你要先从那个方向入手python

 

  1. 大数据开发工程师,这个比较适合刚刚从Java转换过来的人员作,主要学习HDFS,MapReduce,Yarn,Hive,Flume,Sqoop,Spark等技术便可转转型。

 

  1. 数仓工程师:这个须要SQL基础好一些,其余环境配置基本上公司已经完成,主要是针对Hive方向的开发和数据仓库的建模擦操做。

 

  1. 实时工程师:这个主要针对的是Spark部分,SparkStreaming是老牌的实时处理,相对公司使用仍是比较多的,近年来阿里收购了Flink以后,加速了Flink在国内的步伐,因此这个flink最好也要学习,Storm就能够适当的了解。

 

4.数据挖掘:须要学习完成大数据体系,也就是大数据开发工程须要学习的,除了这些外要学会,机器学习R语言主要是为了统计分析和绘图,在Hadoop生态圈中是有本身的机器学习库的mahout提供可扩展的机器学习领域经典算法的实现,包括聚类、分类、推荐过滤、频繁子项挖掘等,且可经过Hadoop扩展,可是鉴于MapReduce的性能,建议学习Spark MLlib: MLlib是Spark是经常使用的机器学习算法的实现库,支持二元分类,回归,聚类以及协同过滤等算法。同时也包括一个底层的梯度降低优化基础算法。除了以外,也能够学系python,python中也有一套完整的机器学习库。算法

相关文章
相关标签/搜索