大数据又称黑暗数据,是指人脑没法处理的海量数据聚合成的信息资产,在民生、IT、金融、农业、通讯等方面都有普遍应用。将来5年大数据行业呈井喷趋势,人才需求火爆,2018年大数据人才缺口更是高达900万。之后想要作大数据相关的工做,须要学习哪些技术知识?java
罗马不是一天建成的,大数据工程师也不是短期能锻造的。想要成为大数据开发工程师,也要看你是否骨骼惊奇,天赋过人!在学习大数据以前,你还须要有必定的基础!大数据学习资料分享群119599574sql
1、学习大数据须要的基础数据库
一、java SE、EE(SSM)编程
90%的大数据框架都是Java写的框架
二、MySQL机器学习
SQL on Hadoop函数
三、Linuxoop
大数据的框架安装在Linux操做系统上学习
在有了上面的技术基础支撑以后,即可以开始咱们的大数据开发工程师的锻造之旅了,能够根据如下三个大的方面进行学习,固然了,中间须要穿插一些项目练习,将理论和实战相关联才能成长的很快!大数据
2、大数据技术须要学什么
一、大数据离线分析
通常处理T+1数据(T:多是1天、一周、一个月、一年)
a、Hadoop :通常不选用新版本,踩坑难解决
(common、HDES、MapReduce、YARN)
环境搭建、处理数据的思想
b、Hive:大数据的数据仓库
通过写SQL对数据进行操做,相似于MySQL数据库的sql
c、HBase:基于HDFS的NOSQL数据库
面向列存储
d、协做框架:
sqoop(桥梁:HDFS《==》RDBMS)
flume:搜集日志文件中的信息
e、调度框架
anzkaban
了解:crotab(Linux自带)
zeus(Alibaba)
Oozie(cloudera)
f、前沿框架扩展:
kylin、impala、ElasticSearch(ES)
二、大数据实时分析
以spark框架为主
Scala:OOP(面向对象程序设计)+FP(函数是程序设计)
sparkCore:类比MapReduce
sparkSQL:类比hive
sparkStreaming:实时数据处理
kafka:消息队列
前沿框架扩展:flink
阿里巴巴:blink
三、大数据机器学习
spark MLlib:机器学习库
pyspark编程:Python和spark的结合
以上就是大数据的学习路线,有兴趣的朋友,也能够了解下人工智能和物联网。
在不久的未来,多智时代必定会完全走入咱们的生活,有兴趣入行将来前沿产业的朋友,能够收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让咱们一块儿携手,引领人工智能的将来