详尽的 Elasticsearch7.X 安装及集群搭建教程

时间 2020-09-23

标签详尽 elasticsearch7.x elasticsearch 安装集群搭建教程栏目日志分析繁體版

原文原文链接

为了更好的阅读体验，欢迎访问原文阅读连接html

简介

首先引用 Elasticsearch （下文简称 ES）官网的一段描述：java

Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎，可以解决不断涌现出的各类用例。做为 Elastic Stack 的核心，它集中存储您的数据，帮助您发现意料之中以及意料以外的状况。node

本文主要介绍 Elasticsearch 集群的搭建。经过在一台服务器上建立 3 个 ES 实例来建立一个建议的 ES 集群。linux

Elasticsearch/ES

官方的Elasticsearch Reference 提供了不一样版本的文档链接，真是赞！git

若是英文的不想看，还提供了中文版的 Elasticsearch 2.x: 权威指南，版本不是最新的，可是了解基本概念也是有帮助的。github

Elasticsearch 7.x 包里自包含了 OpenJDK 的包。若是你想要使用你本身配置好的 Java 版本，须要设置 JAVA_HOME 环境变量 —— 参考shell

官方文档 Set up Elasticsearch 有各个 OS 的安装指导，页面 Installing Elasticsearch 中提供了多种安装包对应的指导连接！bootstrap

本文选择绿色安装包的的方式（tar.gz）安装。vim

因为实验机器有限，能够在同一台机器上模拟出 3 个节点，安装 ES 集群。浏览器

安装 ES

准备工做

{% note warning %}

不能使用 root 用户启动 es，不然会报错：

Caused by: java.lang.RuntimeException: can not run elasticsearch as root

{% endnote %}

若是须要新建用户的话能够运行 sudo adduser es，修改 es 用户的密码：sudo passwd es。

下载 ES 安装包

安装包下载地址：

官方-Past Releases 官网的下载速度龟速
华为镜像站下载速度不错，推荐

下面的步骤参考 Set up Elasticsearch » Installing Elasticsearch » Install Elasticsearch from archive on Linux or MacOS，选择的安装包是 elasticsearch-7.3.0 版本。

# 下载安装包
wget https://mirrors.huaweicloud.com/elasticsearch/7.3.0/elasticsearch-7.3.0-linux-x86_64.tar.gz
wget https://mirrors.huaweicloud.com/elasticsearch/7.3.0/elasticsearch-7.3.0-linux-x86_64.tar.gz.sha512
# 验证安装包的完整性，若是没问题，会输出 OK
shasum -a 512 -c elasticsearch-7.3.0-linux-x86_64.tar.gz.sha512
tar -xzf elasticsearch-7.3.0-linux-x86_64.tar.gz
# 将目录复制三份，做为三个节点，后面配置 ES 集群时，对应了三个 ES 实例
cp -R elasticsearch-7.3.0 es-7.3.0-node-1
cp -R elasticsearch-7.3.0 es-7.3.0-node-2
mv elasticsearch-7.3.0 es-7.3.0-node-3
# 由于以 root 用户启动不了 ES
chown -R es es-7.3.0*

{% note info %}
若是是 Mac 平台，则下载包 elasticsearch-{version}-darwin-x86_64.tar.gz。

MacOS Catalina 在你第一次运行 ES 时，会弹出对话框阻止运行，你须要到设置-》安全隐私中容许才行。为了阻止这种告警，能够运行以下的命令：xattr -d -r com.apple.quarantine <$ES_HOME or archive-or-directory>

{% endnote %}

$ES_HOME 是指 ES 的安装包 tar 包解压后的文件夹目录。

解压后的目录组成：

.
├── bin # 二进制脚本存放目录，包括 elasticsearch 来指定运行一个 node，包括 elasticsearch-plugin 来安装 plugins
├── config # 包含了 elasticsearch.yml 配置文件
├── data # 节点上分配的每一个 index/分片 的数据文件
├── lib
├── LICENSE.txt
├── logs
├── modules
├── NOTICE.txt
├── plugins # 插键文件存放的位置
└── README.textile

运行 Elasticsearch

咱们先运行一个节点，建立 ES 单机版实例：

./bin/elasticsearch

若是要将 ES 做为守护程序运行，请在命令行中指定 -d，指定 -p 参数，将进程 ID 记录到 pid 文件：

./bin/elasticsearch -d -p pid

日志在 $ES_HOME/logs 目录中。

若是要中止 ES，运行以下的命令：

pkill -F pid

检查一下运行状态

curl -X GET "localhost:9200/?pretty"

或者在浏览器中访问 localhost:9200 均可以，会返回：

{
    "name": "node-1",
    "cluster_name": "appsearch-7.3.2",
    "cluster_uuid": "GlzI_v__QJ2s9ewAgomOqg",
    "version": {
        "number": "7.3.0",
        "build_flavor": "default",
        "build_type": "tar",
        "build_hash": "de777fa",
        "build_date": "2019-07-24T18:30:11.767338Z",
        "build_snapshot": false,
        "lucene_version": "8.1.0",
        "minimum_wire_compatibility_version": "6.8.0",
        "minimum_index_compatibility_version": "6.0.0-beta1"
    },
    "tagline": "You Know, for Search"
}

若是你是在远端服务器上部署的 ES，那么，此时在你本地的工做机上还没法调通 <IP>:9200，须要对 ES 进行相关配置才能访问，下文会介绍。

ES 配置相关

官网关于配置的内容主要有两处：

Elasticsearch 主要有三个配置文件：

elasticsearch.yml ES 的配置，more
jvm.options ES JVM 配置，more
log4j2.properties ES 日志配置，more

配置文件主要位于 $ES_HOME/config 目录下，也能够经过 ES_PATH_CONF 环境变量来修改

YAML 的配置形式参考：

path:
    data: /var/lib/elasticsearch
    logs: /var/log/elasticsearch

设置也能够按以下方式展平：

path.data: /var/lib/elasticsearch
path.logs: /var/log/elasticsearch

JVM 配置

JVM 参数设置能够经过 jvm.options 文件（推荐方式）或者 ES_JAVA_OPTS 环境变量来修改。

jvm.options 位于

$ES_HOME/config/jvm.options 当经过 tar or zip 包安装
/etc/elasticsearch/jvm.options 当经过 Debian or RPM packages

官网也介绍了如何设置堆大小。

默认状况，ES 告诉 JVM 使用一个最小和最大都为 1GB 的堆。可是到了生产环境，这个配置就比较重要了，确保 ES 有足够堆空间可用。

ES 使用 Xms(minimum heap size) 和 Xmx(maxmimum heap size) 设置堆大小。你应该将这两个值设为一样的大小。

Xms 和 Xmx 不能大于你物理机内存的 50%。

设置的示例：

-Xms2g 
-Xmx2g

elasticsearch.yml 配置

ES 默认会加载位于 $ES_HOME/config/elasticsearch.yml 的配置文件。

备注：任何可以经过配置文件设置的内容，均可以经过命令行使用 -E 的语法进行指定，例如：

./bin/elasticsearch -d -Ecluster.name=my_cluster -Enode.name=node_1

`cluster.name`

cluster.name 设置集群名称。一个节点只能加入一个集群中，默认的集群名称是 elasticsearch。

cluster.name: search-7.3.2

{% note info %}
确保节点的集群名称要设置正确，这样才能加入到同一个集群中。上面示例就自定义了集群名称为 appsearch-7.3.2。
{% endnote %}

`node.name`

node.name：能够配置每一个节点的名称。用来提供可读性高的 ES 实例名称，它默认名称是机器的 hostname，能够自定义：

node.name: node-1

同一集群中的节点名称不能相同

`network.host`

network.host：设置访问的地址。默认仅绑定在回环地址 127.0.0.1 和 [::1]。若是须要从其余服务器上访问以及多态机器搭建集群，咱们须要设定 ES 运行绑定的 Host，节点须要绑定非回环的地址。建议设置为主机的公网 IP 或 0.0.0.0：

network.host: 0.0.0.0

更多的网络设置能够阅读 Network Settings

`http.port`

http.port 默认端口是 9200 ：

http.port: 9200

{% note warning %}
注意：这是指 http 端口，若是采用 REST API 对接 ES，那么就是采用的 http 协议
{% endnote%}

transport.port

REST 客户端经过 HTTP 将请求发送到您的 Elasticsearch 集群，可是接收到客户端请求的节点不能老是单独处理它，一般必须将其传递给其余节点以进行进一步处理。它使用传输网络层（transport networking layer）执行此操做。传输层用于集群中节点之间的全部内部通讯，与远程集群节点的全部通讯，以及 Elasticsearch Java API 中的 TransportClient。

transport.port 绑定端口范围。默认为 9300-9400

transport.port: 9300

由于要在一台机器上建立是三个 ES 实例，这里明确指定每一个实例的端口。

`discovery.seed_hosts`

discovery.seed_hosts：发现设置。有两种重要的发现和集群造成配置，以便集群中的节点可以彼此发现而且选择一个主节点。官网/Important discovery and cluster formation settings

discovery.seed_hosts 是组件集群时比较重要的配置，用于启动当前节点时，发现其余节点的初始列表。

开箱即用，无需任何网络配置， ES 将绑定到可用的环回地址，并将扫描本地端口 9300 - 9305，以尝试链接到同一服务器上运行的其余节点。这无需任何配置便可提供自动群集的体验。

若是要与其余主机上的节点组成集群，则必须设置 discovery.seed_hosts，用来提供集群中的其余主机列表（它们是符合主机资格要求的master-eligible而且可能处于活动状态的且可达的，以便寻址发现过程）。此设置应该是群集中全部符合主机资格的节点的地址的列表。每一个地址能够是 IP 地址，也能够是经过 DNS 解析为一个或多个 IP 地址的主机名（hostname）。

当一个已经加入过集群的节点重启时，若是他没法与以前集群中的节点通讯，极可能就会报这个错误 master not discovered or elected yet, an election requires at least 2 nodes with ids from。所以，我在一台服务器上模拟三个 ES 实例时，这个配置我明确指定了端口号。

配置集群的主机地址，配置以后集群的主机之间能够自动发现（能够带上端口，例如 127.0.0.1:9300）：

discovery.seed_hosts: ["127.0.0.1:9300","127.0.0.1:9301"]

the default discovery settings are unsuitable for production use; at least one of [discovery.seed_hosts, discovery.seed_providers, cluster.initial_master_nodes] must be configured

必须至少配置 [discovery.seed_hosts，discovery.seed_providers，cluster.initial_master_nodes] 中的一个。

`cluster.initial_master_nodes`

cluster.initial_master_nodes: 初始的候选 master 节点列表。初始主节点应经过其 node.name 标识，默认为其主机名。确保 cluster.initial_master_nodes 中的值与 node.name 彻底匹配。

首次启动全新的 ES 集群时，会出现一个集群引导/集群选举/cluster bootstrapping步骤，该步骤肯定了在第一次选举中的符合主节点资格的节点集合。在开发模式下，若是没有进行发现设置，此步骤由节点自己自动执行。因为这种自动引导从本质上讲是不安全的，所以当您在生产模式下第一次启动全新的群集时，你必须显式列出符合资格的主节点。也就是说，须要使用 cluster.initial_master_nodes 设置来设置该主节点列表。从新启动集群或将新节点添加到现有集群时，你不该使用此设置

在新版 7.x 的 ES 中，对 ES 的集群发现系统作了调整，再也不有 discovery.zen.minimum_master_nodes 这个控制集群脑裂的配置，转而由集群自主控制，而且新版在启动一个新的集群的时候须要有 cluster.initial_master_nodes 初始化集群主节点列表。若是一个集群一旦造成，你不应再设置该配置项，应该移除它。该配置项仅仅是集群第一次建立时设置的！集群造成以后，这个配置也会被忽略的！

{% note warning %}
cluster.initial_master_nodes 该配置项并非须要每一个节点设置保持一致，设置需谨慎，若是其中的主节点关闭了，可能会致使其余主节点也会关闭。由于一旦节点初始启动时设置了这个参数，它下次启动时仍是会尝试和当初指定的主节点连接，当连接失败时，本身也会关闭！

所以，为了保证可用性，预备作主节点的节点不用每一个上面都配置该配置项！保证有的主节点上就不设置该配置项，这样当有主节点故障时，还有可用的主节点不会必定要去寻找初始节点中的主节点！
{% endnote%}

关于 cluster.initial_master_nodes 能够查看以下资料：

其余

集群的主要配置项上面已经介绍的差很少了，同时也给出了一些文档拓展阅读。实际的生产环境中，配置稍微会复杂点，下面补充一些配置项的介绍。须要说明的是，下面的一些配置即便不配置，ES 的集群也能够成功启动的。

Elasticsearch 集群中节点角色的介绍对上文中的 node.master 等配置作了介绍。若是本地仅是简单测试使用，上文中的 node.master/node.data/node.ingest 不用配置也没影响。

建立集群

实验机器有限，咱们在同一台机器上建立三个 ES 实例来建立集群，分别明确指定了这些实例的 http.port 和 transport.port。discovery.seed_hosts明确指定实例的端口对测试集群的高可用性很关键。

若是后期有新节点加入，新节点的 discovery.seed_hosts 不必包含全部的节点，只要它里面包含集群中已有的节点信息，新节点就能发现整个集群了。

集群配置预览

分别进入es-7.3.0-node-1、es-7.3.0-node-2 和 es-7.3.0-node-3 的文件夹，config/elasticsearch.yml 设置以下：

# es-7.3.0-node-1
cluster.name: search-7.3.2
node.name: node-1
node.master: true
node.data: false
node.ingest: false
network.host: 0.0.0.0
http.port: 9200
transport.port: 9300
discovery.seed_hosts: ["127.0.0.1:9300","127.0.0.1:9301","127.0.0.1:9302"]
cluster.initial_master_nodes: ["node-1"]

# es-7.3.0-node-2
cluster.name: search-7.3.2
node.name: node-2
node.master: true
node.data: true
node.ingest: false
network.host: 0.0.0.0
http.port: 9201
transport.port: 9301
discovery.seed_hosts: ["127.0.0.1:9300","127.0.0.1:9301","127.0.0.1:9302"]

# es-7.3.0-node-3
cluster.name: search-7.3.2
node.name: node-3
node.master: true
node.data: true
node.ingest: false
network.host: 0.0.0.0
http.port: 9202
transport.port: 9302
discovery.seed_hosts: ["127.0.0.1:9300","127.0.0.1:9301","127.0.0.1:9302"]

node-1 节点仅仅是一个 master 节点，它不是一个数据节点。

通过上面的配置，能够经过命令 egrep -v "^#|^$" config/elasticsearch.yml 检查配置项。

先启动 node-1 节点，由于它设置了初始主节点的列表。这时候就可使用 http://<host IP>:9200/ 看到结果了。而后逐一启动 node-2 和 node-3。经过访问 http://127.0.0.1:9200/_cat/nodes 查看集群是否 OK：

192.168.3.112 25 87 13 4.29   dm - node-3
192.168.3.112 26 87 16 4.29   dm - node-2
192.168.3.112 35 87 16 4.29   m  * node-1

http://127.0.0.1:9200/_nodes 将会显示节点更多的详情信息

插键显示结果：

五角星表示该节点是主节点，圆圈表示该节点是数据节点

有没有发现，我并无给 node-2 和 node-3 明确指定端口，为何在一台机器上也成功启动了这两个节点？

由于 Elasticsearch 会取用 9200~9299 这个范围内的端口，若是 9200 被占用，就选择 9201，依次类推。

补充：其实，还有一个简单的方法模拟建立集群（该方法我未测试，仅供参考）。

咱们首先将上面运行的三个节点中止掉，而后进入 es-7.3.0-node-1 文件夹下：

mkdir -p data/data{1,2,3}
./bin/elasticsearch -E node.name=node-1 -E cluster.name=appsearch-7.3.2 -E path.data=data/data1 -E path.logs=logs/logs1 -d -p pid1
./bin/elasticsearch -E node.name=node-2 -E cluster.name=appsearch-7.3.2 -E path.data=data/data2 -E path.logs=logs/logs2 -E http.port=9201 -d -p pid2
./bin/elasticsearch -E node.name=node-3 -E cluster.name=appsearch-7.3.2 -E path.data=data/data3 -E path.logs=logs/logs3 -E http.port=9202 -d -p pid3

安装插键

./bin/elasticsearch-plugin install analysis-icu

若是插键安装慢，能够先下载下来，再安装：

wget https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-icu/analysis-icu-7.3.0.zip
./bin/elasticsearch-plugin install file://file path Of analysis-icu-7.1.0.zip

ES-FAQ

Q1：`[1]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]`

echo "vm.max_map_count=262144" > /etc/sysctl.conf
sysctl -p

Q2：`max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]`

sudo vim /etc/security/limits.conf
# 加入如下内容
* soft nofile 300000
* hard nofile 300000
* soft nproc 102400
* soft memlock unlimited
* hard memlock unlimited

Q3：`master_not_discovered_exception`

主节点指定的名字要保证存在，别指定了不存在的节点名。

总结

本文是经过 tar 包方式安装的，安装目录相对集中、配置方便。用 RPM 包安装的话，能够直接用 systemctl 的命令查看 ES 状态、对其重启等。

参考

learnku/Elasticsearch中文文档-7.3版本推荐
ES-CN 官网/Elasticsearch 集群协调迎来新时代对于 ES7 的集群发现机制介绍较为详细，推荐
程序羊-CentOS7上ElasticSearch安装填坑记 FAQ 有帮助
搭建ELFK日志采集系统
静觅—Ubuntu 搭建 Elasticsearch 6 集群流程
ELK 架构之 Elasticsearch 和 Kibana 安装配置
使用 ELK(Elasticsearch + Logstash + Kibana) 搭建日志集中分析平台实践
手把手教你，在CentOS上安装ELK，进行服务器日志收集

最后

本文做者： Michael翔
本文连接： https://michael728.github.io/2020/04/12/elk-es-install/