业务需求是不断变化迭代的,也许咱们以前写的某个业务逻辑在下个版本就变化了,咱们可能须要修改原来的设计,例如数据库可能须要添加一个字段或删减一个字段,而在搜索中也会发生这件事,即便你认为如今的索引设计已经很完美了,在生产环境中,仍是有可能须要作一些修改的,须要添加映射字段或者须要修改字段类型等等。数据库
数据库中咱们能够直接修改原来的表设计语句,前提是须要作好数据迁移。可是在 Elasticsearch 中就没那么简单了。尽管能够增长新的类型到索引中,或者增长新的字段到类型中,可是不能添加新的分析器或者对现有的字段作改动。若是你那么作的话,结果就是那些已经被索引的数据就不正确,搜索也不能正常工做。针对这个问题必须从新创建索引。json
从新创建索引的问题是必须更新应用中的索引名称,索引别名就是用来解决这个问题的!数组
假设咱们有个学生的原始索引 student_index_v1,咱们给它起个别名 student_index,程序中也是用别名 student_index 进行搜索,当咱们的业务需求发生改变须要修改索引的时候,咱们从新建立个索引 student_index_v2,同时将别名 student_index 指向新的索引 student_index_v2,同时将 student_index_v1 的数据迁移到新的 student_index_v2,这样咱们就能够作到在零停机下从旧索引切换到新索引。app
索引别名就像一个快捷方式或软链接,能够指向一个或多个索引,也能够给任何一个须要索引名的API来使用,并且别名不能与索引同名。设计
别名带给咱们极大的灵活性,容许咱们作下面这些:code
别名还能够映射到某个索引也能够映射到多个索引。别名还能够与筛选器关联,筛选器将在搜索和路由值时自动应用,别名不能与索引同名。索引
Elasticsearch 中有两种方式管理别名: _alias
用于单个操做, _aliases
用于执行多个原子级操做。ip
单个索引别名路由
POST /_aliases { "actions" : [ { "add" : { "index" : "test1", "alias" : "alias1" } } ] }
删除别名rem
POST /_aliases { "actions" : [ { "remove" : { "index" : "test1", "alias" : "alias1" } } ] }
重命名别名
POST /_aliases { "actions" : [ { "remove" : { "index" : "test1", "alias" : "alias1" } }, { "add" : { "index" : "test2", "alias" : "alias1" } } ] }
重命名别名是一个简单的删除而后指向新的索引。这个操做是原子性的,所以不须要担忧短期内的别名不指向一个索引。
将别名与多个索引关联
POST /_aliases { "actions" : [ { "add" : { "index" : "test1", "alias" : "alias1" } }, { "add" : { "index" : "test2", "alias" : "alias1" } } ] }
亦能够经过索引数组的方式来实现
POST /_aliases { "actions" : [ { "add" : { "indices" : ["test1", "test2"], "alias" : "alias1" } } ] }
对于上面的示例,还可使 glob pattern 将别名关联到拥有公共名称的多个索引:
POST /_aliases { "actions" : [ { "add" : { "index" : "test*", "alias" : "all_test_indices" } } ] }
Filtered Aliases
过滤器别名提供了一个简单的方法对同一个索引来建立不一样的“视图”。过滤器可以使用Query DSL来定义而且被应用到全部的搜索,统计,经过查询删除和其它相似的行为。
为了建立一个带过滤器的别名,首先须要确保映射的字段已经存在于mapping中。
PUT /test1 { "mappings": { "_doc": { "properties": { "user" : { "type": "keyword" } } } } }
而后咱们能够建立一个在user字段上带过滤器的别名。
POST /_aliases { "actions" : [ { "add" : { "index" : "test1", "alias" : "alias2", "filter" : { "term" : { "user" : "kimchy" } } } } ] }
成功则返回
{"acknowledged":true}
这样设置以后,咱们经过 test1 这个 index 直接进行搜索能够看到索引的所有文档,可是经过 alias2 这个别名就只能看到符合过滤器过滤后的结果了,即只有一个 user 为 "kimchy" 的结果。
Routing
能够将路由值与别名关联。这个特性能够与过滤别名一块儿使用,以免没必要要的碎片操做。
何为路由?
全部的文档 API( get 、 index 、 delete 、 bulk 、 update 以及 mget )都接受一个叫作 routing 的路由参数 ,经过这个参数咱们能够自定义文档到分片的映射。一个自定义的路由参数能够用来确保全部相关的文档---例如全部属于同一个用户的文档都被存储到同一个分片中。
如下命令建立一个指向索引 test 的新别名 alias1。建立 alias1 后,全部具备此别名的操做将自动修改成使用值 1 进行路由:
POST /_aliases { "actions" : [ { "add" : { "index" : "test", "alias" : "alias1", "routing" : "1" } } ] }
还能够为搜索和索引操做指定不一样的路由值
POST /_aliases { "actions" : [ { "add" : { "index" : "test", "alias" : "alias2", "search_routing" : "1,2", "index_routing" : "2" } } ] }
如上例所示,搜索路由(search_routing)可能包含几个用逗号分隔的多个值,可是 索引路由(index_routing)就只能包含一个值。
若是使用路由别名的搜索操做也有路由参数,则使用搜索别名路由和参数中指定的路由的交集。例如,下面的命令将使用“2”做为路由值。由于搜索操做中有路由参数2,3,而搜索路由设置的是1,2,因此取交集即为2。
GET /alias2/_search?q=user:kimchy&routing=2,3
仍然以上面学生的例子, student_index 是一个指向当前真实索引的别名。真实索引包含一个版本号: student_index_v1 , student_index_v2 等等。
首先,建立索引 student_index_v1 ,而后将别名 student_index 指向它:
PUT /student_index_v1 // 建立索引 student_index_v1 。 PUT /student_index_v1/_alias/student_index //设置别名 student_index 指向 student_index_v1 。
你能够检测这个别名指向哪个索引:
GET /*/_alias/student_index
或哪些别名指向这个索引:
GET /student_index_v1/_alias/*
二者都会返回下面的结果:
{ "student_index_v1" : { "aliases" : { "student_index" : { } } } }
而后,咱们决定修改索引中一个字段的映射。固然,咱们不能修改现存的映射,因此咱们必须从新索引数据。 首先, 咱们用新映射建立索引 student_index_v2 :
PUT /student_index_v2 { "mappings": { "my_type": { "properties": { "tags": { "type": "string", "index": "not_analyzed" } } } } }
而后咱们将数据从 student_index_v1 索引到 student_index_v2 ,下面的过程在从新索引你的数据 中已经描述过。一旦咱们肯定文档已经被正确地重索引了,咱们就将别名指向新的索引。
一个别名能够指向多个索引,因此咱们在添加别名到新索引的同时必须从旧的索引中删除它。这个操做须要原子化,这意味着咱们须要使用 _aliases 操做:
POST /_aliases { "actions": [ { "remove": { "index": "student_index_v1", "alias": "student_index" }}, { "add": { "index": "student_index_v2", "alias": "student_index" }} ] }
通过以上几步操做,你的应用就成功在零停机的状况下从旧索引迁移到新索引了。其实别名还有更多管理的语法。
对于新旧索引的文档数据迁移,字段 _source 的一个优势是在Elasticsearch中已经有整个文档。你没必要从源数据中重建索引,并且那样一般比较慢。
为了有效的从新索引全部在旧的索引中的文档,用 scroll 从旧的索引检索批量文档 , 而后用 bulk API 把文档推送到新的索引中。
对现有数据的这类改变最简单的办法就是从新索引:用新的setting建立新的索引并把文档从旧的索引复制到新的索引。
在你的应用中最好的方式是使用别名而不是索引名。这样你就能够在任什么时候候重建索引。别名的开销很小,应该普遍使用。本文主要整理自官方文档。