【3.工程开发】-ES

时间 2019-11-05

标签 3.工程开发繁體版

原文原文链接

咱们用ES做日志检索和简单分析，它适用于全文搜索，近实时分析，也能够做为nosql存储（订单的冷库接入ES），须要关注架构，单机的功能（搜索原理，动态索引），性能(索引和数据组织)，分布式的可靠性，可扩展，一致性。html

概述

搜索引擎和NoSQL数据库功能，用于全文搜索，结构化搜索，近实时分析[竞品：Solr 在传统的搜索应用中表现好于 Elasticsearch，但在处理实时搜索应用时效率明显低于 Elasticsearch
]
指南：https://es.xiaoleilu.com/020_...
经常使用：E（存储和索引）L（数据转换和解析Beat采集过来）K(可视化)
逻辑架构图：

Local FileSystem等。存储：索引信息，集群内信息，mapping,transaction log
lucene directory lucene不一样存储层服务发现的抽象，FSDirectory,RAWDirectory 控制索引文件的位置
discovery Zen 服务发现+选主
river：数据源 mq等
memcached协议：get/set/delete/quitnode

高可用、可扩展、一致性

集群发现与故障处理：
服务发现+选主，ping,rsp包含节点基本信息和该节点认为的master节点，支持非奇数，信息不对等时会有脑裂，要求ping全部节点。返回其余节点认为的主节点，也返回候选主节点（配置中master!=false）。若是第一个不为空，直接选节点最小的，若为空，候选节点>discovery.zen.minimum_master_nodes则选一个状态+nodeid最小的，不然失败。思想就是有旧的master活着尽可能用，投票都要达到法定人数。
主节点是群集中惟一能够更改群集状态的节点。主节点一次处理一个群集状态更新，应用所需的更改并将更新的群集状态发布到群集中的全部其余节点。每一个节点接收发布消息，ack，但不将改变同步到本地的集群状态。若是主服务器discovery.zen.minimum_master_nodes在必定时间内没有从至少节点收到确认（由discovery.zen.commit_timeout设置控制并默认为30秒），则拒绝集群状态更改，从新选主。
无主时默认不能写
一致性
上述主节点有变动时，等待从节点的ack,收到大多数则变动，同步从节点，等待全部从节点的确认才返回客户端。这里全部从节点指的是Allocation IDs中的节点。从节点不可用时，主分片所在节点命令主节点将差别分片的Allocation IDs从同步集合（in-sync set）中删除。而后，主分片所在节点等待主节点删除成功的确认消息，这个确认消息意味着集群一致层（consensus layer）已成功更新，以后，才向客户端确认写请求。这样确保只有包含了全部已确认写入的分片副本才会被主节点选为主分片。
节点的从新加入：Translog+checkpoint
每一个写操做都会分配两个值，Term和SequenceNumber.LocalCheckpoint表明本Shard中全部小于该值的请求都已经处理完毕。GlobalCheckpoint会由Primary进行维护，每一个Replica会向Primary汇报本身的LocalCheckpoint，Primary根据这些信息来提高GlobalCheckpoint。GlobalCheckpoint是一个全局的安全位置，表明其前面的请求都被全部Replica正确处理了，能够应用在节点故障恢复后的数据回补。
分片机制：索引键值hash%分片数量。主分片+副本分片
水平扩展（分片数量不能改变，只能改变每一个节点有几个分片，每一个分片副本分散到哪些节点）
单节点存储瓶颈等时扩展：

处理瓶颈时扩展：

master和节点统一。master只负责索引的建立和删除
负载均衡:轮询

数据处理过程

节点对等写入和读取。写入只能在P分片而后同步复制到R分片，读写转发到主节点或副本节点

更新过程：

搜索：须要先查询排序再取回排序中想要的数据

其中查询：
1）node3建立from+size优先队列
2）请求转发个每一个分片，每一个分片本身获取from+size本地优先队列
3）返回给node3合并产生全局排序
搜索有两种：基于短语的、全文索引
1）基于短语的：低级查询，没有分析，精确查找（加not_analyzed）
2）match,query_string这种高级查询，会产生短语列表和低级查询结合，获得文档相关度。
Elasticsearch经过下面的步骤执行match查询：sql

GET /my_index/my_type/_search
{
    "query": {
        "match": {
            "title": "QUICK!"
        }
    }
}

1.检查field类型,title字段是一个字符串(analyzed)，因此该查询字符串也须要被分析(analyzed)
2.分析查询字符串,查询词QUICK!通过标准分析器的分析后变成单词quick。由于咱们只有一个查询词，所以match查询能够以一种低级别term查询的方式执行。
3.找到匹配的文档
term查询在倒排索引中搜索quick，而且返回包含该词的文档。
4.为每一个文档打分
term查询综合考虑词频（每篇文档title字段包含quick的次数）、逆文档频率（在所有文档中title字段包含quick的次数）、包含quick的字段长度（长度越短越相关）来计算每篇文档的相关性得分_score。
由于match查询须要查询两个关键词："brown"和"dog"，在内部会执行两个term查询并综合两者的结果获得最终的结果。match的实现方式是将两个term查询放入一个bool查询
https://es.xiaoleilu.com/100_Full_Text_Search/05_Match_query.html

数据组织

关系数据库       ⇒ 数据库 ⇒     表    ⇒ 行    ⇒ 列(Columns)
Elasticsearch  ⇒ 索引(=》分片=》segment) ⇒ 类型  ⇒ 文档   ⇒ 字段(Fields)

索引
只是一个用来指向一个或多个分片(shards)的“逻辑命名空间(logical namespace)”.
分片
就是一个Lucene实例，文档存储在分片中，而且在分片中被索引
每一个分片上包含此分片的全部数据索引和数据，咱们的elk，天天都是一个新库（index），为其创建traceid，urlkey索引的含义只是建立索引，并不对全部词都创建倒排索引，虽然自己es每一个词均可搜索
词=》倒排索引
包含每一个filed（term）在每一个文档中的值
写入磁盘的倒排索引是不可变的.不须要加锁，不须要重建任何缓存，能够压缩数据

动态索引、近实时索引：
数据库

Luence per-segment search 索引：段的集合+提交点（包含全部段的文件）缓存

1.当一个文档被索引，它被加入到内存缓存，同时加到事务日志。
2.refresh使得分片的进入以下图描述的状态。每秒分片都进行refeash：
内存缓冲区的文档写入到段中，但没有fsync。
段被打开，使得新的文档能够搜索。
缓存被清除
3.随着更多的文档加入到缓存区，写入日志，这个过程会继续
4.不时地，好比日志很大了，新的日志会建立，会进行一次全提交：
    内存缓存区的全部文档会写入到新段中。
    清除缓存
    一个提交点写入硬盘
    文件系统缓存经过fsync操做flush到硬盘
    事务日志被清除