Elasticsearch模糊查询

时间 2019-12-08

原文原文链接

前缀查询

匹配包含具备指定前缀的项（not analyzed）的字段的文档。前缀查询对应 Lucene 的 PrefixQuery 。html

案例
GET /_search
{ "query": {
    "prefix" : { "user" :  { "value" : "ki", "boost" : 2.0 } }
  }
}

正则表达式查询

regexp （正则表达式）查询容许您使用正则表达式进行项查询。有关支持的正则表达式语言的详细信息，请参阅正则表达式语法。第一个句子中的 “项查询” 意味着 Elasticsearch 会将正则表达式应用于由该字段生成的项，而不是字段的原始文本。正则表达式

注意： regexp （正则表达式）查询的性能很大程度上取决于所选的正则表达式。匹配一切像 “.*” ，是很是慢的，使用回顾正则表达式也是如此。若是可能，您应该尝试在正则表达式开始以前使用长前缀。通配符匹配器 “.*？+” 将主要下降性能。elasticsearch

案例
GET /_search
{
    "query": {
        "regexp":{
            "name.first":{
                "value":"s.*y",
                "boost":1.2
            }
        }
    }
}

通配符查询

匹配与通配符表达式具备匹配字段的文档（not analyzed）。支持的通配符是 “*”，它匹配任何字符序列（包括空字符）；还有 “？”，它匹配任何单个字符。请注意，此查询可能很慢，由于它须要迭代多个项。为了防止极慢的通配符查询，通配符项不该以通配符 “*” 或 “？” 开头。通配符查询对应 Lucene 的 WildcardQuery 。ide

案例
GET /_search
{
    "query": {
        "wildcard" : { "user" : { "value" : "ki*y", "boost" : 2.0 } }
    }
}

###模糊查询数据量越大效率越低，当查询内容较多，数据量较大时建议将该字段设置成text进行分词，而后经过match进行匹配。性能