Hadoop2.x HDFS源码剖析---概述

一、HDFS概述 基于hadoop2.6 HDFS被设计能够运行在通用硬件上、提供流式数据操作、能够处理超大文件的分布式文件系统。 特点:高容错和高吞吐量、易扩展、高可靠性 HDFS的四个核心模块:namenode节点、datanode节点、客户端、HDFS协议(RPC协议、流式接口协议:HTTP和TCP) 基本概念 1、数据块(block) 数据块是HDFS文件处理(读和写)的最小单元,默认是1
相关文章
相关标签/搜索