关于动态Mappin-多字段映射

1. 类型断定json

ElasticSearch在建立index的时候是能够不指定schema的,那么它是怎么知道你使用的是什么类型呢?实际上它是经过给定 document的json来断定的,例如,string的话是用引号引发来的,数字是光溜溜的,boolean类型是true或者false等等。这个 规则很是的简单,可是很是有效。例若有以下的json:bash

{ "field1": "hello", "field2": 1024 }

ES可以很容易断定field1为string类型,field2为数字类型,可是有些状况下,须要把全部的格式都存为string,true和 false就不行了,由于ES会优先将其存为boolean类型,这就须要咱们手动指定schema,另一个问题是,若是咱们对某个index首次插入 数据的时候为某个field插入了一个数字类型,例如:app

curl -XPUT localhost:9200/blog/article/1?pretty -d '{ "field1" : 1024}'

咱们能够查看其mapping:curl

curl -XGET localhost:9200/blog/_mapping?pretty

咱们能够看到其schem以下:ide

{ "blog" : { 
   "article" : {
        "properties" : {
            "field1" : {
                "type" : "long",
                "ignore_malformed" : false
               }
           }
       }
   }
}

这说明ES已经将该字段的类型定义为long了,而后若是咱们插入string,那么就会报错,说类型不匹配:url

curl -XPUT localhost:9200/blog/article/2?pretty -d '{
"field1" : "test string"
}'

返回结果为:spa

{ "error" : "MapperParsingException[Failed to parse [field1]];
nested: NumberFormatException[For input string:
\"test string\"]; ", "status" : 400 }

可是,若是继续插入float型数据是能够的,由于long能够转换为float,以下:日志

curl -XPUT localhost:9200/blog/article/2?pretty -d '{
"field1" : 3.14
}'

这时,咱们在查看schema,能够看到ES将schema修改了。这就会对咱们的数据精度形成影响,为了防止这种状况,或者为了防止已经存在的index添加字段,咱们能够将动态schema关闭,以下:orm

{ "blog" : { "article" : { "dynamic" : "false", "properties" : { ... } } } }

2.动态mappingblog

有时,咱们须要经过json中的field和type来决定咱们使用的mapping,这时,动态templates就派上用场了。动态 templates和普通的mapping相似,它有一个本身的模式,若是一个field的名字匹配了该模式,该template就会使用,下面是定义模 式的两种手段:


match: template在field名匹配的时候起用。

unmatch: template在field名不匹配的时候起用。

固然,也可使用path_match和path_unmatch对嵌套field使用。

定义field的使用可使用


{name}: document最初写入数据的field的名字。

{dynamic_type}: document最初写入数据的field的type。

须要提醒的是,ES是按照你写的templates的顺序来匹配的,所以,匹配范围越广的应该放在越后,否则就会将全部后面的正则拦掉了。例如*应该放在最后:

{ 
    "mappings" : { 
        "article" : { 
            "dynamic_templates" : [ { 
                "template_test": {
                     "match" : "*", 
                     "mapping" : {
                          "type" : "multi_field",
                          "fields" : { 
                              "{name}": { "type" : "{dynamic_type}"}, 
                              "str": {"type" : "string"} 
                        }
                    } 
                }
            }]
        } 
    } 
}


例如我在logstash的日志发现了一个错误,以下

"response"=>"-"

"error"=>"MapperParsingException[failed to parse [response];

 nested: NumberFormatException[For input string: \"-\"; "


,这是由于我以前在mapping中定义了response为long类型,如今写入的数据中出现了response=> "-",致使报错类型不匹配。

 {
   "dynamic_templates" : [ { 

        "response_fields": {

          "match" : "*",

          "mapping" : {

            "type" : "multi_field",

            "fields" : {

              "response": { "type" : "long"}, "str": {"type" : "string"}

            }

          }

        }

     }

  }



文章原链:http://www.dengchuanhua.com/

相关文章
相关标签/搜索