coreseek/sphinx中的匹配模式

时间 2019-11-17

原文原文链接

所谓匹配模式就是用户如何根据关键字在索引库中查找相关的记录。

SPH_MATCH_ALL, 匹配全部查询分词(默认模式);
如“手机配件”，不匹配 “我有一部手机”,但能够匹配 “手机坏了，须要找配件”。
由于“手机配件” 被分红 “手机”，“配件”两个词，匹配条件是必须同时包含这两个词，因此“我有一部手机”不符合匹配要求。

SPH_MATCH_ANY, 匹配查询词中的任意一个分词;
如“手机配件”，会匹配“我有一部手机”,由于索引库只要包含任一个分词便可被搜到，固然也能匹配“手机坏了，须要找配件”。

SPH_MATCH_PHRASE, 将整个查询看做一个词组，要求按顺序完整匹配;
这个与select * from [tab] where key like '%手机配件%'相相似，如“手机配件”，不匹配 “手机坏了，须要找配件”,但能够匹配 “你这儿有手机配件吗?”。

SPH_MATCH_BOOLEAN, 将查询看做一个布尔表达式, 能够简单的与或非运算；
如( cat !dog ) | ( cat !mouse)
意思是搜索出全部匹配cat，但不匹配dog和mouse的查询分词。

SPH_MATCH_EXTENDED2,扩展匹配模式
将查询看做一个Sphinx/Coreseek内部查询语言的表达式。
在扩展查询模式中可使用以下特殊操做符：

php

或（OR）操做符:

hello | world

python

非（NOT）操做符:

hello -world
hello !world

函数

字段（field）搜索符:

@title hello @body world
#title 字段中包含hello body字段中包含world

spa

字段限位修饰符

@body[50] hello
#body位数限制在50之内

code

多字段搜索符:

@(title,body) hello world
#title 或 body字段中包含Hello world

索引

全字段搜索符:

@* hello
#只要其中一列包含hello

文档

近似搜索符:

"hello world"~10
#hello world之间最多有10个词

it

阀值匹配符:

"the world is a wonderful place"/3
#至少匹配3个词

扩展

严格有序搜索符（即“在前”搜索符）:

aaa << bbb << ccc
#aaa,bbb,ccc必须按前后顺序出现
select

字段开始和字段结束修饰符

^hello ... world$
#限定必须以hello开头，以world结尾

如："hello world" @title "example program"~10 @body python -(php|perl) @* code
要求同时匹配：
在文档的任意字段中找相邻的“hello”和“world”
文档的title字段中还必须包含 “example”和“program”这两个词，而且他们之间至多有10个（不包括10个）其余的词
同时，body字段必须含有词“python”，但既没有“php”也没有“perl”
任一字段中包含”code“

SPH_MATCH_EXTENDED, 同SPH_MATCH_EXTENDED2, 为了兼容旧版本；

SPH_MATCH_FULLSCAN, 强制使用下文所述的“完整扫描”模式来对查询进行匹配；

注意，在此模式下，全部的查询词都被忽略，尽管过滤器、过滤器范围以及分组仍然起做用，但任何文本匹配都不会发生.

这里不作文本匹配，即便你传递查询词也将被忽略，通常做为过滤来用，好比说，我在餐厅索引中搜索北京的全部餐厅，我只要将北京地名的id用SetFilter方法来过滤便可。PHP中经过setMatchMode函数来设置，如：<?php$sc = new SphinxClient();$sc->setMatchMode(SPH_MATCH_ANY);