ElasticSearch 学习记录之集群分片内部原理

分片是如何工做的
- 为何ES搜索是近实时性的
- 为何CRUD 操做也是实时性
- ES 是怎么保证更新被持久化时断电也不丢失数据
- 为何删除文档不会当即释放空间
- refresh, flush, 和 optimize API 做用
使文本可被搜索
倒排索引的结构html

词项文档列表
Term | Doc 1 | Doc 2 | Doc 3 | ...
------------------------------------
brown | X | | X | ...
fox | X | X | X | ...
quick | X | X | | ...
the | X | | X | ...缓存
倒排索引的不变性
- 不须要锁
- 可被内核的文件系统缓存，停留在内存中，大部分请求会直接请求到内存，不会落到磁盘上
- filter缓存，在索引的生命周期始终有效。不须要再每次数据改变时重建
- 写入单个较大的倒排索引使容许数据被压缩
如何在索引不变状况下 动态更新索引
- 使用更多的索引，来解决这个问题
- 经过增长新的补充索引来反映新近的修改，而不是直接重写整个倒排索引
- 一个 Lucene 索引包含一个提交点和三个段
  elasticsearch
- 逐段搜索的流程
  - 新文档被收集到内存索引缓存
  - 不时地, 缓存被提交
    - 一个新的段----一个追加的倒排索引--被写入磁盘
    - 一个新的包含新段名字的提交点被写入磁盘
    - 磁盘进行同步 — 全部在文件系统缓存中等待的写入都刷新到磁盘
  - 新的段被开启，让它包含的文档可见以被搜索
  - 内存缓存被清空，等待接收新的文档
- 一个在内存缓存中包含新文档的 Lucene 索引
- 在一次提交后，一个新的段被添加到提交点并且缓存被清空
删除和更新文档
- 段是不可改变的，每一个提交点都会有一个.del文件。在这个文件中能列出这些删除文档的短信息
- 当文档被删除时不是删除，只是在.del文件中被登记
- 文档的更新也是这样的，先将更新的文档标记为删除。而后文档的新版本被索引到一个新的段中

近实时搜索

提交（Commiting）一个新的段到磁盘须要一个 fsync 来确保段被物理性地写入磁盘，这样在断电的时候就不会丢失数据。可是每次提交的一个新的段都fsync 这样操做代价过大。可使用下面这种更轻量的方式
在内存缓冲区中包含了新文档的 Lucene 索引
- Lucene 容许新段被写入和打开--使其包含的文档在未进行一次完整提交时便对搜索可见
缓冲区的内容已经被写入一个可被搜索的段中，但尚未进行提交
- 这里新段会被先写入到文件系统缓存--这一步代价会比较低，稍后再被刷新到磁盘--这一步代价比较高
默认状况下每一个分片会每秒自动刷新一次
- 近实时搜索: 文档的变化并非当即对搜索可见，但会在一秒以内变为可见
- POST /_refresh // 刷新Refresh 全部的索引
- POST /blogs/_refresh // 只刷新Refresh blogs 索引
  能够在settings 设置对定时刷新频率的大小
PUT /my_logs
{
"settings": {
"refresh_interval": "30s" //30秒刷新一次
"refresh_interval": "-1" //关闭自动刷新
"refresh_interval": "1s"//每秒自动刷新
}
}分布式

持久化变动
在没有 fsync 把数据从内存刷新到硬盘中，咱们不能保证数据在断电或程序退出时以后依然存在
即时每秒刷新，也不能实现近实时搜索。咱们任然有另外的方法确保从失败中回复数据
ES 增长一个translog，或者叫作事务日志。在每次操做是均进行日志记录
整个流程是以下的操做
1. 一个文档被索引以后，就会被添加到内存缓冲区，而且追加到了 translog
  -学习
2. 刷新（refresh）使分片处于缓存被清空，可是事务日志不会的状态
  - 内存缓冲区的文档被写入新的段中，可是没有进行fsync
  - 段被打开，且可被搜索到
  - 内存缓冲区被清空
3. 进程继续进行，更多的文档被添加到内存缓冲区和追加的事务日志中
4. 每隔一段时间，translog太大或索引被刷新。一个新的translog被建立，而且被全量提交
  -ui
  - 全部内存缓冲区的文档都被写入一个新的段中
  - 缓冲区内清空
  - 一个提交点被写入硬盘
  - 文件系统缓存经过fsync被刷新
  - 老的translog 被删除
translog 提供全部没有被刷新到磁盘操做的一个持久化记录。当ES启动时，会根据最后一个提交点去恢复已知的段
translog 也可供用来提供实时的CRUD。但咱们进行一些CRUD操做时，它会首先检查translog任何最近的变动。
flush API 执行一次提交，并截断translog的操做
- 分片默认每30M自动flush一次。translog太大也会自动flush
- 可经过本身执行flush API操做设计
  
  POST /blogs/_flush //刷新索引日志
  
  POST /_flush?wait_for_ongoing //刷新索引并等待全部的刷新结果返回htm

段合并

段合并的时候会将那些旧的已删除的文档从文件系统中删除，被删除或者被更新的文档不会被复制到新的大段中
段合并的流程
-blog
- 当索引的时候，刷新（refresh）操做会建立新的段
- 合并的时候会选择一部分大小类似的段，而且将其合并到更大的段中
- 段的合并结束，老的段就要被删除
optimized API 的做用
- optimize API大可看作是强制合并 API 。

ElasticSearch 学习记录之集群分片内部原理

ElasticSearch 系列文章

分片内部原理

近实时搜索

持久化变动

段合并