Elasticsearch 5.0-基础概念

Elasticsearch 5.0-基础概念

标签 : Elasticsearchhtml


[TOC]node


本文是 Elasticsearch 5.0 系列博文的基础概念篇,主要介绍集群,节点,索引,类型,文档,分片,副本等基础概念git

写在前面

  • 本文以 Elasticsearch 5.0.1 版本为例进行讲解,不按期更新
  • 该系列主要参考的 Elasticsearch Reference: 5.0,尽可能避免照搬翻译,只摘录精要部分辅以简单说明
  • 写这个系列博客的初衷是强迫本身梳理,同时方便一些较忙/没空耐心看英文文档的朋友快速上手,建议读者有空多读官方文档,毕竟别人写的都是二手资料
  • 如需查看 ES 系列更多博文,请关注个人我的网站@brianway 或者 @CSDN

基本概念

有关概念在Basic Concepts中已经介绍的很详细了,这里简单说一下。github

  • 集群(cluster):集群由一个或者多个节点组成,由名称惟一标识
  • 节点(node):一个单独的 Elasticsearch 实例
  • 索引(index):文档的集合
  • 类型(type):索引的逻辑分类/分区
  • 文档(document):可以被索引的信息基础单元
  • 分片(shard):索引的物理分区,是一个最小的 Lucene 索引单元。分为 primary shard(主分片) 和 replica shard(简称replicas)。
  • 副本/备份(replicas):主分片的备份

下面就这几个概念进一步说明数据库

类比关系型数据库

其中索引,类型,文档的概念能够类比关系型数据库elasticsearch

Elasticsearch 关系型数据库
索引(index) 数据库(database)
类型(type) 表(table)
文档(document) 行记录(row)
字段(field) 列(column)

为何有shard和replica

为何有 shard?ide

  • 能够水平切分和扩展内容容量
  • 在shards 间分发和并行执行操做,从而提供性能和吞吐量

为何有replica?性能

  • 当 shard 失效时提供高可用性。由于这个缘由,一个primary shard的replica不会分配到和该shard所处的同一节点
  • 扩展查询的容量/吞吐量,由于查询操做是一个读操做,能够在全部replica上并行执行

其余补充

Elasticsearch 默认为每一个 index 建立 5 个主分片,且备份数为 1。也就是说,每一个索引由 5 个主分片组成,而且每一个分片拥有一个备份。须要注意的是,主分片的数量一旦肯定,以后是不能更改的(除非从新创建索引),而 replicas 的数量能够在以后随时更改。网站

因此在上一篇文章中,咱们启动 Kibana 后在 Consonle 查询索引状态GET /_cat/indices?v,会发现 healthyellow 而不是 green,就是由于咱们只开启了一个节点,并且 Kibana 启动后在 Elasticsearch 中创建了一个默认索引 .kibana,该索引只有 1 个主分片和一个副本,故 shard 都在该节点上,而 shard 的副本不能和该 shard 分配在同一节点,故未生效,从而致使状态是黄色。ui

另外,每一个索引被分配到多个分片,但 number_of_shards 的值只适用于索引,而不是整个集群。这个值指定了每一个索引的分片数,而非整个集群中的所有主分片数。(摘自Optimizing Elasticsearch: How Many Shards per Index?


做者@brianway更多文章:我的网站 | CSDN | oschina

相关文章
相关标签/搜索