Elasticsearch入门，这一篇就够了

时间 2019-11-18

原文原文链接

实时搜索引擎Elasticsearch

Elasticsearch（简称ES）是一个基于Apache Lucene(TM)的开源搜索引擎，不管在开源仍是专有领域，Lucene能够被认为是迄今为止最早进、性能最好的、功能最全的搜索引擎库。javascript

Elasticsearch简介

Elasticsearch是什么

Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎，不管在开源仍是专有领域，Lucene能够被认为是迄今为止最早进、性能最好的、功能最全的搜索引擎库。
可是，Lucene只是一个库。想要发挥其强大的做用，你需使用Java并要将其集成到你的应用中。Lucene很是复杂，你须要深刻的了解检索相关知识来理解它是如何工做的。
Elasticsearch也是使用Java编写并使用Lucene来创建索引并实现搜索功能，可是它的目的是经过简单连贯的RESTful API让全文搜索变得简单并隐藏Lucene的复杂性。
不过，Elasticsearch不只仅是Lucene和全文搜索引擎，它还提供：css

分布式的实时文件存储，每一个字段都被索引并可被搜索
实时分析的分布式搜索引擎
能够扩展到上百台服务器，处理PB级结构化或非结构化数据

并且，全部的这些功能被集成到一台服务器，你的应用能够经过简单的RESTful API、各类语言的客户端甚至命令行与之交互。上手Elasticsearch很是简单，它提供了许多合理的缺省值，并对初学者隐藏了复杂的搜索引擎理论。它开箱即用（安装便可使用），只需不多的学习既可在生产环境中使用。Elasticsearch在Apache 2 license下许可以使用，能够免费下载、使用和修改。
随着知识的积累，你能够根据不一样的问题领域定制Elasticsearch的高级特性，这一切都是可配置的，而且配置很是灵活。html

以上内容来自 [百度百科]java

Elasticsearch中涉及到的重要概念

Elasticsearch有几个核心概念。从一开始理解这些概念会对整个学习过程有莫大的帮助。node

（1）接近实时（NRT）
Elasticsearch是一个接近实时的搜索平台。这意味着，从索引一个文档直到这个文档可以被搜索到有一个轻微的延迟（一般是1秒）。linux

（2）集群（cluster）
一个集群就是由一个或多个节点组织在一块儿，它们共同持有你整个的数据，并一块儿提供索引和搜索功能。一个集群由一个惟一的名字标识，这个名字默认就是“elasticsearch”。这个名字是重要的，由于一个节点只能经过指定某个集群的名字，来加入这个集群。在产品环境中显式地设定这个名字是一个好习惯，可是使用默认值来进行测试/开发也是不错的。git

（3）节点（node）
一个节点是你集群中的一个服务器，做为集群的一部分，它存储你的数据，参与集群的索引和搜索功能。和集群相似，一个节点也是由一个名字来标识的，默认状况下，这个名字是一个随机的漫威漫画角色的名字，这个名字会在启动的时候赋予节点。这个名字对于管理工做来讲挺重要的，由于在这个管理过程当中，你会去肯定网络中的哪些服务器对应于Elasticsearch集群中的哪些节点。github

一个节点能够经过配置集群名称的方式来加入一个指定的集群。默认状况下，每一个节点都会被安排加入到一个叫作“elasticsearch”的集群中，这意味着，若是你在你的网络中启动了若干个节点，并假定它们可以相互发现彼此，它们将会自动地造成并加入到一个叫作“elasticsearch”的集群中。sql

在一个集群里，只要你想，能够拥有任意多个节点。并且，若是当前你的网络中没有运行任何Elasticsearch节点，这时启动一个节点，会默认建立并加入一个叫作“elasticsearch”的集群。shell

（4）索引（index）
一个索引就是一个拥有几分类似特征的文档的集合。好比说，你能够有一个客户数据的索引，另外一个产品目录的索引，还有一个订单数据的索引。一个索引由一个名字来标识（必须所有是小写字母的），而且当咱们要对对应于这个索引中的文档进行索引、搜索、更新和删除的时候，都要使用到这个名字。索引相似于关系型数据库中Database的概念。在一个集群中，若是你想，能够定义任意多的索引。

（5）类型（type）
在一个索引中，你能够定义一种或多种类型。一个类型是你的索引的一个逻辑上的分类/分区，其语义彻底由你来定。一般，会为具备一组共同字段的文档定义一个类型。好比说，咱们假设你运营一个博客平台而且将你全部的数据存储到一个索引中。在这个索引中，你能够为用户数据定义一个类型，为博客数据定义另外一个类型，固然，也能够为评论数据定义另外一个类型。类型相似于关系型数据库中Table的概念。

（6）文档（document）
一个文档是一个可被索引的基础信息单元。好比，你能够拥有某一个客户的文档，某一个产品的一个文档，固然，也能够拥有某个订单的一个文档。文档以JSON（Javascript Object Notation）格式来表示，而JSON是一个处处存在的互联网数据交互格式。
在一个index/type里面，只要你想，你能够存储任意多的文档。注意，尽管一个文档，物理上存在于一个索引之中，文档必须被索引/赋予一个索引的type。文档相似于关系型数据库中Record的概念。实际上一个文档除了用户定义的数据外，还包括_index、_type和_id字段。

（7）分片和复制（shards & replicas）
一个索引能够存储超出单个结点硬件限制的大量数据。好比，一个具备10亿文档的索引占据1TB的磁盘空间，而任一节点都没有这样大的磁盘空间；或者单个节点处理搜索请求，响应太慢。

为了解决这个问题，Elasticsearch提供了将索引划分红多份的能力，这些份就叫作分片。当你建立一个索引的时候，你能够指定你想要的分片的数量。每一个分片自己也是一个功能完善而且独立的“索引”，这个“索引”能够被放置到集群中的任何节点上。
分片之因此重要，主要有两方面的缘由：

容许你水平分割/扩展你的内容容量
容许你在分片（潜在地，位于多个节点上）之上进行分布式的、并行的操做，进而提升性能/吞吐量

至于一个分片怎样分布，它的文档怎样聚合回搜索请求，是彻底由Elasticsearch管理的，对于做为用户的你来讲，这些都是透明的。

在一个网络/云的环境里，失败随时均可能发生，在某个分片/节点不知怎么的就处于离线状态，或者因为任何缘由消失了。这种状况下，有一个故障转移机制是很是有用而且是强烈推荐的。为此目的，Elasticsearch容许你建立分片的一份或多份拷贝，这些拷贝叫作复制分片，或者直接叫复制。复制之因此重要，主要有两方面的缘由：

在分片/节点失败的状况下，提供了高可用性。由于这个缘由，注意到复制分片从不与原/主要（original/primary）分片置于同一节点上是很是重要的。
扩展你的搜索量/吞吐量，由于搜索能够在全部的复制上并行运行

总之，每一个索引能够被分红多个分片。一个索引也能够被复制0次（意思是没有复制）或屡次。一旦复制了，每一个索引就有了主分片（做为复制源的原来的分片）和复制分片（主分片的拷贝）之别。分片和复制的数量能够在索引建立的时候指定。在索引建立以后，你能够在任什么时候候动态地改变复制数量，可是不能改变分片的数量。

默认状况下，Elasticsearch中的每一个索引被分片5个主分片和1个复制，这意味着，若是你的集群中至少有两个节点，你的索引将会有5个主分片和另外5个复制分片（1个彻底拷贝），这样的话每一个索引总共就有10个分片。一个索引的多个分片能够存放在集群中的一台主机上，也能够存放在多台主机上，这取决于你的集群机器数量。主分片和复制分片的具体位置是由ES内在的策略所决定的。

以上部份内容转自Elasticsearch基础教程，并对其进行了补充。

Elasticsearch安装与配置

安装与运行

(1) 从这里下载Elasticsearch安装包。一共提供4种格式的安装包（ZIP、TAR.GZ、DEB和RPM），能够根据本身所使用的系统平台选择相应格式的安装包进行下载。（建议使用Linux系统，本人在2台windows机器上尝试启动过，一台机器上没法正常启动，另一台能够）

(2) 对下载的安装包进行解压缩便可完成安装操做。下面以在Ubuntu操做系统下使用TAR.GZ格式的1.5.0版本的安装包为例进行安装。在Linux shell中输入下面的命令解压缩。

tar –vxf elasticsearch-1.5.0.tar.gz

安装成功，下面运行ES。

注意：Elasticsearch须要Java虚拟机的支持，在运行以前保证机器上安装了JDK，而且JDK版本不能低于1.7_55。

(3) 如今能够直接使用默认配置启动Elasticsearch了。
假设安装包解压后的目录路径为【/home/elasticsearch/elasticsearch-1.5.0】，下面军用$ES_HOME来表示这个路径。执行下面的命令：

cd /home/elasticsearch/elasticsearch-1.5.0/bin/ chmod +x * ./elasticsearch

若是出现如图所示的界面（最后打印出started），则说明Elasticsearch启动成功。

下面来验证一下是否真的启动成功。打开浏览器，访问网址 http://host:9200（这里的host是ES的安装主机地址，若是安装在本机，就是http://127.0.0.1:9200）。若是显示下面的信息，则表示ES安装成功。

{
  "status" : 200, "name" : "Captain Zero", "cluster_name" : "elasticsearch", "version" : { "number" : "1.5.0", "build_hash" : "544816042d40151d3ce4ba4f95399d7860dc2e92", "build_timestamp" : "2015-03-23T14:30:58Z", "build_snapshot" : false, "lucene_version" : "4.10.4" }, "tagline" : "You Know, for Search" }

上面是前台启动方式，一旦关闭Linux shell，ES服务就会中止。因此是实际使用过程当中，绝对不会使用这种方式去启动ES。除了上面的启动方式外，还能够加上必定的启动参数。例如：

./elasticsearch –d #在后台运行Elasticsearch

./elasticsearch -d -Xmx2g -Xms2g #后台启动，启动时指定内存大小（2G）

./elasticsearch -d -Des.logger.level=DEBUG #能够在日志中打印出更加详细的信息。

ES的配置

配置文件所在的目录路径以下：$ES_HOME/config/elasticsearch.yml。
下面介绍一些重要的配置项及其含义。

（1）cluster.name: elasticsearch

配置elasticsearch的集群名称，默认是elasticsearch。elasticsearch会自动发如今同一网段下的集群名为elasticsearch的主机，若是在同一网段下有多个集群，就能够用这个属性来区分不一样的集群。生成环境时建议更改。

（2）node.name: “Franz Kafka”

节点名，默认随机指定一个name列表中名字，该列表在elasticsearch的jar包中config文件夹里name.txt文件中，其中有不少做者添加的有趣名字，大部分是漫威动漫里面的人物名字。生成环境中建议更改以能方便的指定集群中的节点对应的机器

（3）node.master: true

指定该节点是否有资格被选举成为node，默认是true，elasticsearch默认集群中的第一台启动的机器为master，若是这台机挂了就会从新选举master。

（4）node.data: true

指定该节点是否存储索引数据，默认为true。若是节点配置node.master:false而且node.data: false，则该节点将起到负载均衡的做用

（5）index.number_of_shards: 5

设置默认索引分片个数，默认为5片。经本人测试，索引分片对ES的查询性能有很大的影响，在应用环境，应该选择适合的分片大小。

（6）index.number_of_replicas:

设置默认索引副本个数，默认为1个副本。此处的1个副本是指index.number_of_shards的一个彻底拷贝；默认5个分片1个拷贝；即总分片数为10。

（7）path.conf: /path/to/conf

设置配置文件的存储路径，默认是es根目录下的config文件夹。

（8）path.data:/path/to/data1,/path/to/data2

设置索引数据的存储路径，默认是es根目录下的data文件夹，能够设置多个存储路径，用逗号隔开。

（9）path.work:/path/to/work

设置临时文件的存储路径，默认是es根目录下的work文件夹。

（10）path.logs: /path/to/logs

设置日志文件的存储路径，默认是es根目录下的logs文件夹

（11）path.plugins: /path/to/plugins

设置插件的存放路径，默认是es根目录下的plugins文件夹

（12）bootstrap.mlockall: true

设置为true来锁住内存。由于当jvm开始swapping时es的效率会下降，因此要保证它不swap，能够把ES_MIN_MEM和ES_MAX_MEM两个环境变量设置成同一个值，而且保证机器有足够的内存分配给es。同时也要容许elasticsearch的进程能够锁住内存，linux下能够经过ulimit -l unlimited命令。

（13）network.bind_host: 192.168.0.1

设置绑定的ip地址，能够是ipv4或ipv6的，默认为0.0.0.0。

（14）network.publish_host: 192.168.0.1

设置其它节点和该节点交互的ip地址，若是不设置它会自动判断，值必须是个真实的ip地址。

（15）network.host: 192.168.0.1

这个参数是用来同时设置bind_host和publish_host上面两个参数。

（16）transport.tcp.port: 9300

设置节点间交互的tcp端口，默认是9300。

（17）transport.tcp.compress: true

设置是否压缩tcp传输时的数据，默认为false，不压缩。

（18）http.port: 9200

设置对外服务的http端口，默认为9200。

（19）http.max_content_length: 100mb

设置内容的最大容量，默认100mb

（20）http.enabled: false

是否使用http协议对外提供服务，默认为true，开启。

（21）gateway.type: local

gateway的类型，默认为local即为本地文件系统，能够设置为本地文件系统，分布式文件系统，hadoop的HDFS，和amazon的s3服务器，其它文件系统的设置。

（22）gateway.recover_after_nodes: 1

设置集群中N个节点启动时进行数据恢复，默认为1。

（23）gateway.recover_after_time: 5m

设置初始化数据恢复进程的超时时间，默认是5分钟。

（24）gateway.expected_nodes: 2

设置这个集群中节点的数量，默认为2，一旦这N个节点启动，就会当即进行数据恢复。

（25）cluster.routing.allocation.node_initial_primaries_recoveries: 4

初始化数据恢复时，并发恢复线程的个数，默认为4。

（26）cluster.routing.allocation.node_concurrent_recoveries: 2

添加删除节点或负载均衡时并发恢复线程的个数，默认为4。

（27）indices.recovery.max_size_per_sec: 0

设置数据恢复时限制的带宽，如入100mb，默认为0，即无限制。

（28）indices.recovery.concurrent_streams: 5

设置这个参数来限制从其它分片恢复数据时最大同时打开并发流的个数，默认为5。

（29）discovery.zen.minimum_master_nodes: 1

设置这个参数来保证集群中的节点能够知道其它N个有master资格的节点。默认为1，对于大的集群来讲，能够设置大一点的值（2-4）

（30）discovery.zen.ping.timeout: 3s

设置集群中自动发现其它节点时ping链接超时时间，默认为3秒，对于比较差的网络环境能够高点的值来防止自动发现时出错。

（31）discovery.zen.ping.multicast.enabled: false

设置是否打开多播发现节点，默认是true。

（32）discovery.zen.ping.unicast.hosts: [“host1”, “host2:port”, “host3 [portX-portY] “]

设置集群中master节点的初始列表，能够经过这些节点来自动发现新加入集群的节点。

除了上面的在安装时配置文件中就自带的配置项外，本人在实际使用过程还使用到了下面的配置：

threadpool:
    search:
        type: fixed min: 60 max: 80 queue_size: 1000 // 配置es服务器的执行查询操做时所用线程池，fix固定线程数的线程池。

index :
    store:
        type: memory // 表示索引存储在内存中，固然es不太建议这么作。经本人测试，作查询时，使用内存索引并不会比正常的索引快。

index.mapper.dynamic: false // 禁止自动建立mapping。默认状况下，es能够根据数据类型自动建立mapping。配置成这样，能够禁止自动建立mapping的行为。至于什么是mapping，在以后的博文中再介绍。

index.query.parse.allow_unmapped_fields: false // 不能查找没有在mapping中定义的属性

以上总结介绍了Elasticsearch中的一些基础知识，包括其中的一些核心概念。只有理解了ES中的这些核心概念，才能对更加驾轻就熟地使用ES，发挥其强大的搜索能力。同时，也介绍了ES的安装和运行，ES的安装和运行是很简单的，只须要极少的简单步骤，就能够开始体验ES。ES的配置很是丰富，安装时自带的配置文件只包含一部分比较核心的配置项，更多的配置内容须要本身去阅读ES的源码时才能被发现。

ES Restful API基本使用：

ES为开发者提供了很是丰富的基于HTTP协议的Rest API，只须要向ES服务端发送简单的Rest请求，就能够实现很是强大的功能。本篇文章主要介绍ES中经常使用操做的Rest API的使用，同时会讲解ES的源代码工程中的API接口文档，经过了解这个API文档的接口描述结构，就基本上能够实现ES中的绝大部分功能。

注意：查询是ES的核心。做为一个先进的搜索引擎，ES中提供了多种查询接口。本篇仅仅会涉及查询API的结构，而具体如何使用ES所提供的各类查询API，会在接下来的博文中作详细介绍。

基础知识

若是以前没有用过相似于ES这样的索引数据库（暂且将ES归为数据库类，与传统的数据库有较大的区别），要理解本篇博文介绍的API是有些难度的。本节先介绍一些基础知识，对理解全文有很帮助。

Rest介绍

笔者在学习软件开发过程当中，屡次听到过Rest Http这个概念，但在很长的一段时间里，死活搞不懂这玩意究竟是个什么东西。刚开始看相关资料时，看得云里雾里，彻底不知所云 _。这玩意太过于抽象和理论，内心以为有必要搞这么复杂么。随着本身动手开发的东西愈来愈多，才开始对它有了一丢丢感受。

Rest彻底不是三言两语就能将清楚的，它有本身的一套体系，因此笔者打算之后单独写一些有关Rest的博文。在这里推荐一篇优秀的文章，它对Rest讲的至关清楚，本人看完以后真有醍醐灌顶的感受！

Mapping详解

Mapping是ES中的一个很重要的内容，它相似于传统关系型数据中table的schema，用于定义一个索引（index）的某个类型（type）的数据的结构。

在传统关系型数据库，咱们必须首先建立table并同时定义其schema，以下面的SQL语句。下面代码中小括号内的代码的做用就是定义person_info的schema（模式）。

create table person_info ( name varchar(20), age tinyint )

在ES中，咱们无需手动建立type（至关于table）和mapping(相关与schema)。在默认配置下，ES能够根据插入的数据自动地建立type及其mapping。在下面的API介绍部分中，会作相关的试验。固然，在实际使用过程当中咱们可能就想硬性规定mapping，能够经过配置文件关闭ES的自动建立mapping功能。

mapping中主要包括字段名、字段数据类型和字段索引类型这3个方面的定义。

字段名：这就不用说了，与传统数据库字段名做用同样，就是给字段起个惟一的名字，好让系统和用户能识别。

字段数据类型：定义该字段保存的数据的类型，不符合数据类型定义的数据不能保存到ES中。下表列出的是ES中所支持的数据类型。（大类是对全部类型的一种归类，小类是实际使用的类型。）

大类	包含的小类
String	string
Whole number	byte, short, integer, long
Floating point	float, double
Boolean	boolean
Date	date

字段索引类型：索引是ES中的核心，ES之因此可以实现实时搜索，彻底归功于Lucene这个优秀的Java开源索引。在传统数据库中，若是字段上创建索引，咱们仍然可以以它做为查询条件进行查询，只不过查询速度慢点。而在ES中，字段若是不创建索引，则就不能以这个字段做为查询条件来搜索。也就是说，不创建索引的字段仅仅能起到数据载体的做用。string类型的数据确定是平常使用得最多的数据类型，下面介绍mapping中string类型字段能够配置的索引类型。

索引类型	解释
analyzed	首先分析这个字符串，而后再创建索引。换言之，以全文形式索引此字段。
not_analyzed	索引这个字段，使之能够被搜索，可是索引内容和指定值同样。不分析此字段。
no	不索引这个字段。这个字段不能被搜索到。

若是索引类型设置为analyzed，在表示ES会先对这个字段进行分析（通常来讲，就是天然语言中的分词），ES内置了很多分析器（analyser），若是以为它们对中文的支持很差，也可使用第三方分析器。因为笔者在实际项目中仅仅将ES用做普通的数据查询引擎，因此并无研究过这些分析器。若是将ES当作真正的搜索引擎，那么挑选正确的分析器是相当重要的。

mapping中除了上面介绍的3个主要的内容外，还有其余的定义内容，详见官网文档。

经常使用的Rest API介绍

下面介绍一下ES中的一些经常使用的Rest API。掌握了这些API的用法，基本上就能够简单地使用ES了。

咱们须要借助可以发送HTTP请求的工具调用这些API，工具是能够任意的，包括网页浏览器。这里利用Linux上的curl命令来发送HTTP请求。基本的命令结构为：

curl <-Xaction> url -d 'body' # 这里的action表示HTTP协议中的各类动做，包括GET、POST、PUT、DELETE等。

注意。文中的示例代码里面包含了用户注释的文字，就是 # 号后面的文字。运行代码时，请注意删除这些注释。

查看集群（Cluster）信息相关API

（1）查看集群健康信息。

curl -XGET "localhost:9200/_cat/heath?v"

返回结果为：

epoch timestamp cluster status node.total node.data shards pri relo init unassign pending_tasks 1440206633 18:23:53 elasticsearch green 1 1 0 0 0 0 0 0

返回结果的主要字段意义：

cluster：集群名，是在ES的配置文件中配置的cluster.name的值。
status：集群状态。集群共有green、yellow或red中的三种状态。green表明一切正常（集群功能齐全），yellow意味着全部的数据都是可用的，可是某些复制没有被分配（集群功能齐全），red则表明由于某些缘由，某些数据不可用。若是是red状态，则要引发高度注意，数据颇有可能已经丢失。
node.total：集群中的节点数。
node.data：集群中的数据节点数。
shards：集群中总的分片数量。
pri：主分片数量，英文全称为private。
relo：复制分片总数。
unassign：未指定的分片数量，是应有分片数和现有的分片数的差值（包括主分片和复制分片）。

咱们也能够在请求中添加help参数来查看每一个操做返回结果字段的意义。

curl -XGET "localhost:9200/_cat/heath?help"

返回结果以下：

epoch         | t,time | seconds since 1970-01-01 00:00:00 timestamp | ts,hms,hhmmss | time in HH:MM:SS cluster | cl | cluster name status | st | health status node.total | nt,nodeTotal | total number of nodes node.data | nd,nodeData | number of nodes that can store data shards | t,sh,shards.total,shardsTotal | total number of shards pri | p,shards.primary,shardsPrimary | number of primary shards relo | r,shards.relocating,shardsRelocating | number of relocating nodes init | i,shards.initializing,shardsInitializing | number of initializing nodes unassign | u,shards.unassigned,shardsUnassigned | number of unassigned shards pending_tasks | pt,pendingTasks | number of pending tasks

确实是很好很强大。有了这个东东，就能够减小看文档的时间。ES中许多API均可以添加help参数来显示字段含义，哪些能够这么作呢？每一个API都试试就知道了。

固然，若是你以为返回的东西太多，看着眼烦，咱们也能够人为地指定返回的字段。

curl -XGET "localhost:9200/_cat/health?h=cluster,pri,relo&v"

此次的返回结果就简单不少罗。对于患有严重强迫症的患者来讲，这是福音啊！

cluster pri relo elasticsearch 0 0

（2）查看集群中的节点信息。

curl -XGET "localhost:9200/_cat/nodes?v"

返回节点的详细信息以下：

host          ip            heap.percent ram.percent load node.role master name master.hadoop localhost 3 35 0.00 d * Ezekiel

（3）查看集群中的索引信息。

curl -XGET "localhost:9200/_cat/indices?v"

返回集群中的索引信息以下：

health status index      pri rep docs.count docs.deleted store.size pri.store.size yellow open index_test 5 1 0 0 575b 575b

更多的查看和监视ES的API参见官网文档。

索引（Index）相关API

（1）建立一个新的索引。

curl -XPUT "localhost:9200/index_test"

若是返回下面的信息，则说明索引建立成功。若是不是，则ES会返回相应的异常信息。一般能够经过异常信息的最后一项推断出失败的缘由。

{
    "acknowledged": true }

上面的操做使用默认的配置信息建立一个索引。大多数状况下，咱们想在索引建立的时候就将咱们所需的mapping和其余配置肯定好。下面的操做就能够在建立索引的同时，建立settings和mapping。

curl -XPUT "localhost:9200/index_test" -d ' # 注意这里的'号 { "settings": { "index": { "number_of_replicas": "1", # 设置复制数 "number_of_shards": "5" # 设置主分片数 } }, "mappings": { # 建立mapping "test_type": { # 在index中建立一个新的type(至关于table) "properties": { "name": { # 建立一个字段（string类型数据，使用普通索引） "type": "string", "index": "not_analyzed" }, "age": { "type": "integer" } } } } }'

（2）删除一个索引。

curl -XDELETE "localhost:9200/index_test"

若是返回与建立索引一样的信息，则说明删除成功。反之，则返回相应的异常信息。更多的索引操做参见ES官网文档。

映射（Mapping）相关API

（1）建立索引的mapping。

curl -XPUT 'localhost:9200/index_test/_mapping/test_type' -d ' { "test_type": { # 注意，这里的test_type与url上的test_type名保存一致 "properties": { "name": { "type": "string", "index": "not_analyzed" }, "age": { "type": "integer" } } } }'

若是不想单首创建mapping，可使用上一节的方法（建立索引时建立mappings）。

假设咱们的项目中有多个环境（开发环境、测试环境等），那每个环境的mapping总要一致的吧，那每次建立一次mappings就比较麻烦了，并且还容易致使数据不一致。莫急，ES还给咱们准备另一种建立mapping的方式。能够按照下面的步骤来作。

步骤1 建立一个扩展名为test_type.json的文件名，其中type_test就是mapping所对应的type名。

步骤2 在test_type.json中输入mapping信息。假设你的mapping以下：

{
  "test_type": { # 注意，这里的test_type与json文件名必须一致 "properties": { "name": { "type": "string", "index": "not_analyzed" }, "age": { "type": "integer" } } } }

步骤3 在$ES_HOME/config/路径下建立mappings/index_test子目录，这里的index_test目录名必须与咱们要创建的索引名一致。将test_type.json文件拷贝到index_tes目录下。

步骤4 建立index_test索引。操做以下：

curl -XPUT "localhost:9200/index_test" # 注意，这里的索引名必须与mappings下新建的index_test目录名一致

这样咱们就建立了一个新的索引，而且使用了test_type.json所定义的mapping做为索引的mapping。就是这么简单方便！

（2）删除mapping。

curl -XDELETE 'localhost:9200/index_test/_mapping/test_type'

（3）查看索引的mapping。

curl -XGET 'localhost:9200/index_test/_mapping/test_type'

更多的mapping相关操做参加官网文档。

文档（document）相关API

（1）新增一个文档。

curl -XPUT 'localhost:9200/index_test/test_type/1?pretty' -d ' # 这里的pretty参数的做用是使得返回的json显示地更加好看。1是文档的id值（惟一键）。 { "name": "zhangsan", "age" : "12" }'

（2）更新一个文档

curl -XPOST 'localhost:9200/index_test/test_type/1?pretty' -d ' # 这里的1必须是索引中已经存在id，不然就会变成新增文档操做 { "name": "lisi", "age" : "12" }'

（3）删除一个文档

curl -XDELETE 'localhost:9200/index_test/test_type/1?pretty' # 这里的1必须是索引中已经存在id

（4）查询单个文档

curl -XGET 'localhost:9200/index_test/test_type/1?pretty'

上面的操做仅仅查询id为1的一条文档，这样看彷佛ES的查询也太弱了。前面已经说过了，查询操做是ES中的核心，是其立身的根本。可是本文的重点并不在这里，为了防止文章的篇幅过长，以后将专本介绍ES中的查询操做。

源代码中提供的Rest API文档结构

ES的源代码托管在Github上。将源代码下载下来以后，里面有一个文件夹专门存放ES中绝大部分的Rest API。有了这些文档，就没必要每次都要到官网上查询接口文档了（PS：ES的官网真的很慢）。
下面以cat.health.json文件为例简单地介绍这些Rest API文档的结构。一旦结构搞清楚了，文档看起来就比较顺心，ES用起来就更加驾轻就熟了！

{
  "cat.health": { "documentation": "http://www.elastic.co/guide/en/elasticsearch/reference/master/cat-health.html", # 该文档对应的官方站点 "methods": ["GET"], "url": { # url部分可选 "path": "/_cat/health", "paths": ["/_cat/health"], "parts": { }, "params": { "local": { "type" : "boolean", "description" : "Return local information, do not retrieve the state from master node (default: false)" }, "master_timeout": { "type" : "time", "description" : "Explicit operation timeout for connection to master node" }, "h": { "type": "list", "description" : "Comma-separated list of column names to display" }, "help": { "type": "boolean", "description": "Return help information", "default": false }, "ts": { "type": "boolean", "description": "Set to false to disable timestamping", "default": true }, "v": { "type": "boolean", "description": "Verbose mode. Display column headers", "default": true } } }, "body": null } }

上面文档接口所对应的Reqeust操做以下：

curl -XGET "localhost:9200/_cat/health?v" -d 'body'

该操做命令可划分为5个部分，下面把这5个部分与文档对应起来。经过这个例子，就能够在阅读其余文档后，使用正确的操做了。

第1部分（-XGET）：对应文档中methods所包含的GET操做。
第2部分（localhost:9200）：是ES服务端所在主机的hostname和port。
第3部分（/_cat/health）：对应文档中的url。其中path是最简单的url；paths是除了path以外的其余url；parts描述和解释paths里面的url的可变部分（一般用{}包裹，如{index}）。
第4部分v：表示参数，对应文档中的params。像“v”这种boolean类型的参数，不须要特地指定其布尔值（true或者false），出现即表示true，不然为false。
第5部分body：表示要传递的数据主体,对应文档中的body。若是body里面指明“required=true”,则表示必须传入body数据。具体body里面须要传怎样的数据，则能够访问文档中的documentation字段所指明的官方站点进行查询。

总结

本文重点介绍了ES中的一些经常使用Rest API的用法，并在开始部分简单地介绍了一些基础知识（Rest和mapping）。掌握了这些API的调用，就能够利用ES完成简单的应用程序了。固然，ES的API远不止这些，若是想要更加深刻地了解ES的使用及其内部原理，建议先仔细地阅读ES的官网文档。而后下载其源代码进行研究。

想进阶的同窗，请参考：