Elasticsearch入门二

时间 2021-04-01

标签 java node 服务器架构负载均衡分布式 code 索引路由同步栏目日志分析繁體版

原文原文链接

1、ES基础概念

1.复杂的分布式机制，好比分片、副本、负载均衡等等，所有都隐藏起来
2.扩容方案(垂直扩容、水平扩容)
3.增长或者减小节点时的数据rebalance：总有某些服务器的负载会重一些，承载的数量和请求量会大一些
4.mater节点:java

(1)管理es集群的元数据,好比说索引的建立和删除,维护索引元数据;节点的增长和移除，维护集群的元数据
(2)默认状况下，会自动选择出一台节点，做为mater节点
(3)mater节点不承载全部的请求，因此不会是单点瓶颈

5.节点对等的分布式架构node

(1)节点对等，每一个节点都能接收全部的请求
(2)节点的自动路由

2、shard和replica机制详解

index包含多个shard
每一个shard都是一个最小工做单元，承载部分数据
增减节点时，shard会自动的nodes中负载均衡
每一个document只能存在于一个primary shard中。
replica shrad是primary shard的副本，负责容错以及承担读请求负载
primary shard的数量再建立索引的时候就固定了，replica shard的数据能够随时更改
replica shard 不能和primary shard放在同一个节点上，可是能够和别的primary shard的replica shard 放在同一个节点

3、指定index的primary shard的数量

PUT /test_index
    {
        "settings":{
            "number_of_shards":3,
            "number_of_replicas":1
        }
    }

4、容错的过程

当有一个node宕机，这个机器上的某个primary shard 就没了，此时status就不是active，状态也会修改为red。
(1) 容错第一步：mater 选举，自动选择另外一个node成为新的mater，承担起master的责任
(2) 容错第二步：新的master，将丢失掉的primary shard的某个replica shard提高为primary shard，此时cluster status会变为yellow，由于primary shard 所有都变成了active。可是少了一个replica shard,因此不是全部的replica shard 都是active
(3)容错第三步：重启故障的node，新的mater会将缺失的副本都时copy一份到该node上，并且该node会使用以前已有的shard数据，只是同步一下宕机以后发生过的修改。cluster status 变为green。服务器