Hadoop 简介（转）

时间 2019-11-21

标签 hadoop 简介栏目 Hadoop 繁體版

原文原文链接

Hadoop - 简介

Hadoop可运行于通常的商用服务器上，具备高容错、高可靠性、高扩展性等特色服务器

特别适合写一次，读屡次的场景架构

适合

大规模数据
流式数据（写一次，读屡次）
商用硬件（通常硬件）

不适合

低延时的数据访问
大量的小文件
频繁修改文件（基本就是写1次）

Hadoop架构

HDFS: 分布式文件存储
YARN: 分布式资源管理
MapReduce: 分布式计算
Others: 利用YARN的资源管理功能实现其余的数据处理方式

内部各个节点基本都是采用Master-Woker架构ssh

Hadoop安装

单节点安装分布式

全部服务运行在一个JVM中，适合调试、单元测试oop
伪集群单元测试

全部服务运行在一台机器中，每一个服务都在独立的JVM中，适合作简单、抽样测试测试
多节点集群spa

服务运行在不一样的机器中，适合生产环境调试

配置公共账号code

方便主与从进行无密钥通讯，主要是使用公钥/私钥机制全部节点的账号都同样在主节点上执行 ssh-keygen -t rsa生成密钥对复制公钥到每台目标节点中

Hadoop配置

有两种配置文件：

一种是**-default.xml（只读，默认的配置）

一种是**-site.xml（替换default中的配置）

core-site.xml 配置公共属性
hdfs-site.xml 配置HDFS
yarn-site.xml 配置YARN
mapred-site.xml 配置MapReduce

配置文件应用的顺序：

在JobConf中指定的
客户端机器上的**-site.xml配置
slave节点上的**-site.xml配置
**-default.xml中的配置

若是某个属性不想被覆盖，能够将其设置成final

<property> <name>{PROPERTY_NAME}</name> <value>{PROPERTY_VALUE}</value> <final>true</final> </property>

相关文章

1. [ Hadoop ] Hadoop简介
2. HDFS介绍（十） Hadoop MapReduce简介（转）
3. Hadoop简介
4. 【hadoop】1.简介
5. hadoop简介
6. Hadoop的简介
7. Hadoop1-Hadoop简介
8. Hadoop简介-yellowcong
9. Hadoop——简介
10. Hadoop 简介
更多相关文章...
• Scala 简介 - Scala教程
• AJAX 简介 - PHP教程
• Github 简明教程
• Java Agent入门实战（一）-Instrumentation介绍与使用

相关标签/搜索

Hibernate教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<