视频jourk--hadoop2.x介绍与安装

时间 2019-11-06

标签视频 jourk hadoop2.x hadoop 介绍安装栏目 Hadoop 繁體版

原文原文链接

1、 hadoop介绍

1.hadoop的由来：（google三篇论文）

(2003)GFS --> HDFSweb
(2004)MapReduce --> MapReduce并发
(2006)BigTable --> HBase(Hadoop DataBase)负载均衡

2.hadoop的著名案例

Facebook : HiveQL进行数据分析；框架
淘宝搜索：Hive自定义筛选；分布式
eBay ：数据仓库；oop
Twitter ：Pig高级数据处理，发现可能认识的人；大数据
Amazon ：协同过滤的推荐，及淘宝推荐；优化
Yahoo ：pig，垃圾邮件的识别过滤及用户特征建模；google
天猫：hive，推荐系统（广告联盟），少许尝试mahout。6:56spa

3.hadoop的特色

扩容能力（Scalable）：可靠的存储和处理PB级数据；
成本低（Economical）：廉价机集群；
高效率（Efficient）：并发；
可靠行（Reliable）：存储多个副本；

4.hadoop核心

HDFS 海量存储（通讯RPC）；

2.x比1.x的优化：

NameNodeHA：1.x只有一个，2.x有多个；
federation：

DataNode：有多个块Block，每一个块有128M；
NameNode的Metadata记录位置：

FileName：文件名
replicas：副本数
block_ids：block块
id2host：id和主机名关系

MapReduce 海量计算：
YARN（Yet Anothor Resource Negotiator）：资源调度管理系统；

2、hadoop安装

1.安装环境：须要6台机器

2台（机器1+机器2--JDK+Hadoop）运行NameNode（HDFS的老大）：HA

NameNode、DFSZKFailoverController.
NameNode、DFSZKFailoverController.

1台（机器3--JDK+Hadoop）运行ResourceManager（YARN的老大）；

ResourceManager

3台（机器4+机器5+机器6--JDK+Hadoop+Zookeeper）运行DataNode，并安装ZK（奇数个）

DataNode、NodeManager(YARN的小弟)、JournalNode（实时数据同步）、QuorumPeerMain（ZK的节点）。
DataNode、NodeManager(YARN的小弟)、JournalNode（实时数据同步）、QuorumPeerMain（ZK的节点）。
DataNode、NodeManager(YARN的小弟)、JournalNode（实时数据同步）、QuorumPeerMain（ZK的节点）。

Zookeeper（ZK-2181）是大数据协调管理框架，能够进行master选举、负载均衡、分布式锁、配置信息维护等；

2.集群部署：

相关文章

1. Jenkins X介绍及安装
2. TypeScript介绍视频
3. Elasticsearch 7.x安装配置介绍
4. Django介绍与安装
5. Fiddler（一）介绍与安装
6. Redis介绍与安装
7. redis安装与介绍
8. MongoDB介绍与安装
9. ActiveMQ (一) 介绍与安装
10. Kdevelop安装与介绍
更多相关文章...
• MySQL视图简介 - MySQL教程
• 网站主机介绍 - 网站主机教程
• Composer 安装与使用
• Java Agent入门实战（一）-Instrumentation介绍与使用

相关标签/搜索

Hibernate教程

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<