课程大纲:
第1节项目介绍以及在本课程中能学到什么东西、如何应用到实际项目中
第2节scala和IDE的安装以及使用以及maven插件的安装
第3节Centos环境准备(java环境、hosts配置、防火墙关闭)
第4节scala基础知识讲解-1
第5节scala基础知识讲解-函数和闭包-2
第6节scala基础知识讲解-数组和集合-3.1
第7节scala基础知识讲解-数组和集合-3.2
第8节scala基础知识讲解-类和对象-4
第9节scala基础知识讲解-特征和模式匹配-5
第10节scala基础知识讲解-正则表达式和异常处理-6
第11节scala基础知识讲解-知识回顾
第12节nosql数据库mongodb安装
第13节spring data for mongodb-简单链接mongodb
第14节spring data for mongodb-spring配置+CRUD操做(不实现repo,默认操做)
第15节spring data for mongodb-实现repo接口+mongoTemplate+CRUD操做
第16节spring data for mongodb-分页查询
第17节zookeeper集群安装
第18节zookeeper基本介绍-1
第19节zookeeper工做原理-选举流程(basic paxos算法)-2
第20节zookeeper工做原理-选举流程(fast paxos算法)-3
第21节kafka-背景及架构介绍
第22节kafka集群安装以及测试
第23节kafka数据发送与接收实现-java
第24节hdfs单机安装部署
第25节链接hdfs查询存储-java
第26节机器学习基本线性代数介绍
第27节IKAnalyzer中文分词工具介绍
第28节IKAnalyzer中文分词工具结合java应用
第29节Spark以及生态圈介绍
第30节Spark运行架构介绍及原理之job,stage,task
第31节Spark编程模型RDD设计以及运行原理
第32节纯手写第一个Spark应用程序:WordCount
第33节RDD经常使用函数介绍
第34节Spark Sql介绍、DataFrame建立以及使用、RDD DataFrame DataSet相互转化
第35节Spark Streaming介绍
第36节Spark Streaming+Kafka集成操做
第37节avro结合maven使用,实现序列化和反序列化
第38节Spark ML(机器学习)介绍(监督学习、半监督学习、无监督学习)
第39节特征抽取:TF-IDF原理介绍
第40节特征提取:TF-IDF代码实现计算
第41节聚类算法:KMEANS原理介绍
第42节聚类算法:KMEANS代码实现计算
第43节其它Spark ML算法简单介绍
第44节Spark链接Mongodb代码实现
第45节Mesos整体架构介绍
第46节Mesos安装部署
第47节Spark on Mesos安装部署
第48节系统总体架构再次介绍+技术串联介绍(将学习的技术所有整合到项目中)
第49节项目代码:父类工程,管理各个jar的版本
第50节项目代码:avro序列化jar,用于客户端和机器学学习实现序列化和反序列化
第51节项目代码:kafka发送数据jar,给app调用并实现切词并发送数据到kafka
第52节项目代码:工具类jar,实现操做hdfs、切词以及操做mongodb
第53节项目代码:操做类jar,调用工具类具体进行切词以及数据清洗而且存储到Hdfs
第54节项目代码:机器学习集合jar,主要用来存放record
第55节项目代码:机器学习算法jar,主要进行tf-idf以及kmeans计算,主要实现企业上下游、供求上下游模型计算
第56节项目代码:流式计算jar,主要是接受客户端发送到kafka的数据加载模型进行计算
第57节项目代码:测试模拟jar,主要模拟实现用户加载avro序列化jar写数据到kafka
第58节Spark on Mesos部署提交参数介绍
第59节Spark代码提交到Mesos运行(Spark-submit)
第60节项目总体流程跑通,结果展现
第61节Spark调优介绍
第62节基于Spark的机器学习项目-智能客户系统实战课程总结
第63节实际工做及面试注意问题java
下载地址:大数据-基于Spark的机器学习-智能客户系统项目实战面试