目录结构知识点仍是挺全的,能够按照点学习。算法
1、Hadoop入门,了解什么是Hadoop | 2、分布式文件系统HDFS,是数据库管理员的基础课程 |
一、Hadoop产生背景数据库 二、Hadoop在大数据、云计算中的位置和关系编程 三、国内外Hadoop应用案例介绍架构 四、国内Hadoop的就业状况分析及课程大纲介绍负载均衡 五、分布式系统概述框架 六、Hadoop生态圈以及各组成部分的简介分布式 七、Hadoop核心MapReduce例子说明函数 |
一、分布式文件系统HDFS简介oop 二、HDFS的系统组成介绍学习 三、HDFS的组成部分详解 四、副本存放策略及路由规则 五、NameNode Federation 六、命令行接口 七、Java接口 八、客户端与HDFS的数据流讲解 九、HDFS的可用性(HA) |
3、初级MapReduce,成为Hadoop开发人员的基础课程 | 4、高级MapReduce,高级Hadoop开发人员的关键课程 |
一、如何理解map、reduce计算模型 二、剖析伪分布式下MapReduce做业的执行过程 三、Yarn模型 四、序列化 五、MapReduce的类型与格式 六、MapReduce开发环境搭建 七、MapReduce应用开发 八、更多示例讲解,熟悉MapReduce算法原理 |
一、使用压缩分隔减小输入规模 二、利用Combiner减小中间数据 三、编写Partitioner优化负载均衡 四、如何自定义排序规则 五、如何自定义分组规则 六、MapReduce优化 七、编程实战 |
5、Hadoop集群与管理,是数据库管理员的高级课程 | 6、ZooKeeper基础知识,构建分布式系统的基础框架 |
一、Hadoop集群的搭建 二、Hadoop集群的监控 三、Hadoop集群的管理 四、集群下运行MapReduce程序 |
一、ZooKeeper体现结构 二、ZooKeeper集群的安装 三、操做ZooKeeper |
7、HBase基础知识,面向列的实时分布式数据库 | 8、HBase集群及其管理 |
一、HBase定义 二、HBase与RDBMS的对比 三、数据模型 四、系统架构 五、HBase上的MapReduce 六、表的设计 |
一、集群的搭建过程讲解 二、集群的监控 三、集群的管理 |
9、HBase客户端 | 10、Pig基础知识,进行Hadoop计算的另外一种框架 |
一、HBase Shell以及演示 二、Java客户端以及代码演示 |
一、Pig概述 二、安装Pig 三、使用Pig完成手机流量统计业务 |
11、Hive,使用SQL进行计算的Hadoop框架 | 12、Sqoop,Hadoop与rdbms进行数据转换的框架 |
一、数据仓库基础知识 二、Hive定义 三、Hive体系结构简介 四、Hive集群 五、客户端简介 六、HiveQL定义 七、HiveQL与SQL的比较 八、数据类型 九、表与表分区概念 十、表的操做与CLI客户端演示 十一、数据导入与CLI客户端演示 十二、查询数据与CLI客户端演示 1三、数据的链接与CLI客户端演示 1四、用户自定义函数(UDF)的开发与演示 |
一、配置Sqoop 二、使用Sqoop把数据从MySQL导入到HDFS中 三、使用Sqoop把数据从HDFS导出到MySQL中 十3、Storm一、Storm基础知识:包括Storm的基本概念和Storm应用 二、Storm集群搭建:详细讲述Storm集群的安装和安装时 三、Storm组件介绍: spout、bolt、stream groupings等 四、Storm消息可靠性:消息失败的重发 五、Hadoop 2.0和Storm的整合:Storm on YARN 六、Storm编程实战 |
十4、论坛日志分析项目 | |
该项目的数据来自于某网站论坛的日志,它是为本课程量身定作的,很是适合咱们Hadoop课程学习。有的同窗以为应该介绍更多项目,其实作过几个项目后,就会发现项目的思路是相同的,只是业务不一样而已。 你们写过这个项目后,就对Hadoop的各个框架在项目中是如何使用的,以及Hadoop与JavaEE结合有一个比较清晰的认识与了解。 |