Elasticsearch基本概念

时间 2020-01-15

标签 elasticsearch 基本概念栏目日志分析繁體版

原文原文链接

􏱍􏴖􏰬􏳤􏴗node

文档（Document）

- Elasticsearch是面向文档的，文档是全部可搜索数据的最小单位
- 文档会被序列化成JSON格式，保持在Elasticsearch中􏲍􏱂􏵓􏵔􏵖􏴚􏵐􏴣 􏲯􏵓􏵗􏵘 􏰴 􏰠􏵙 􏰴 􏰙􏵚 􏰴
- 每个文档都有一个UniqueID

文档的元数据

索引（Index）服务器

Index- 索引是文档的容器，是一类文档的结合网络

- Index体现了逻辑空间的概念：每个索引都有本身的Mapping定义，用于定义包含的文档的字段名和字段类型
- Shard体现了物理空间的概念：索引中的数据分散在Shard上

索引的Mapping与Settings架构

Type

- 在7.0以前，一个index能够设置多个Types
- 6.0开始，Type已经被Deprecated。7.0开始一个索引只能建立一个Type -"_doc"

1. 节点是一个Elasticsearch的实例，本质上就是一个JAVA进程
2. 每个节点都有名字，经过配置文件配置，或者启动时候指定
3. 每个节点在启动以后，会分配一个UID，保存在data目录下

DataNode(数据节点)
- 能够保存数据的节点。负责保存分片数据。在数据扩展上起到了相当重要的做用
Coordination Node（协调节点）
- 负责接收Client的请求，将请求分发到合适的节点，最终把结果聚集到一块儿
- 每一个节点默认都起到了Coordination Node的职责 􏳺􏰃􏰏􏰐􏰒􏰓􏲭􏰒􏰎􏰁􏳁􏰁􏰂􏰎􏰒 􏰄􏲷􏳀􏰒􏰏 􏳺􏰃􏰏􏰐􏰒􏰓􏲭􏰒􏰎􏰁􏳁􏰁􏰂􏰎􏰒 􏰄􏲷􏳀􏰒􏰏
Hot&Warm Node
- 不一样硬件配置的Data Node，用来实现Hot&Warm架构，下降集群部署的成本
Machine Learning Node
- 负责跑机器学习的Job,用来作异常检测
Ingest Node
- Ingest Node 能够看做是数据前置处理转换的节点，支持 pipeline管道设置，可使用 ingest 对数据进行过滤、转换等操做，相似于 logstash 中 filter 的做用。
Tribe Node
- 5.3开始使用Cross Cluster Search）TribeNode 链接到不一样的Elasticsearch集群，而且支持将这些集群当成一个单独的集群处理

节点角色划分及资源使用状况

Elasticsearch提供了一个很是全面和强大的REST API,使用它与集群进行交互app

1. 检查群集，节点和索引运行情况，状态和统计信息
2. 管理您的群集，节点和索引数据和元数据
3. 对索引执行CRUD（建立，读取，更新和删除）和搜索操做
4. 执行高级搜索操做，例如分页，排序，过滤，脚本编写，聚合等

􏱍􏴖􏰬􏳤􏴗机器学习