1. 数据块node
在 HDFS 中抽象为 block ,包含三种成员变量:blockID、numbytes(文件数据大小)、generationStamp(数据块版本号。每次对数据块修改,版本号都会修改,还用于数据一致性检查,具备相同 blockID 可是版本号不一样的数据块至少有一个是无效的 ,须要删除)数组
数据块名词为 blk_<blockid>对象
locatedBlock:已经肯定了储存位置的数据块,成员变量有 block 、数据块所在节点信息 locs、数据块在对应文件中的偏移量,locs 是一个类型为 DatanodeDeInfo 的数组,包含了全部可用的数据块的位置。io
locatedBlocks:能够用于一次定位多个数据块,包含一系列的 locatedblock 对象。集群
2. 与 datanode 相关:datanodeID、datanodeinfo变量
datanodeID:做用是在集群中惟一肯定某一数据节点能够从中获取到数据节点的主机地址。数据
datanodeinfo:提供附加信息,包括容量、已使用容量、剩余容量、数据节点在集群中的位置,数据节点状态信息等。db