hadoop_namenode若是选择在哪一个datanode存储副本

须要从可靠性,写入带宽,读取带宽进行权衡。node

第一个block副本放在运行client所在的节点上(若是client不在集群范围内,则第一个node是随机选取的)性能

第二个block副本放置在与第一个节点不一样的机架中的node中(随机选择)集群

第三个block副本放置与第二个副本所在节点同一个机架的另外一个节点上。cli

若是还有更多的副本就随机放在集群的node里,不过系统会尽可能避免在同一个机架上放太多副本。遍历

良好的稳定性:数据块存储在两个机架中数据

写入带宽:写入操做只须要遍历一个交换机客户端

读取性能:能够从两个机架中选择读取block

集群中块的均匀分布:客户端只在本地机架上写入一个块。系统

相关文章
相关标签/搜索