solr1.4之后实现的智能提示,方便用户输入搜索 java
Suggest配置 apache
<searchComponent name="suggest" class="solr.SpellCheckComponent"> <str name="queryAnalyzerFieldType">string</str> <lst name="spellchecker"> <str name="name">suggest</str> <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str> <str name="field">name</str> <float name="threshold">0.0001</float> <!--<str name="sourceLocation">suggest_dict.txt</str>--> <!--<str name="spellcheckIndexDir">spellchecker</str>--> <str name="comparatorClass">freq</str> <str name="buildOnOptimize">true</str> <str name="buildOnCommit">true</str> </lst> </searchComponent> <requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchHandler"> <lst name="defaults"> <str name="spellcheck">true</str> <str name="spellcheck.dictionary">suggest</str> <str name="spellcheck.count">8</str> <str name="spellcheck.onlyMorePopular">true</str> <str name="spellcheck.extendedResults">false</str> <str name="spellcheck.collate">true</str> <!--<str name="spellcheck.build">true</str> --> </lst> <arr name="components"> <str>suggest</str> </arr> </requestHandler>
说明: ide
1.solr的suggest基于solr.SpellCheckComponent ui
2.queryAnalyzerFieldType 参数为string,在这不要定义复杂分词,若是是根据某一个索引字段,意义不大 spa
3.field字段名,表示基于schema中的某一个索引字段 code
4.threshold限制一些不经常使用的词出现,值越大过滤纸越多 component
5.sourceLocation用于设置字典,若是有一个字典能记录用户常搜索的字,那提示更更好 server
6.spellcheckIndexDir若是已经设置spellcheck,那么能够在此制定目录 xml
7.字典格式以下 排序
# This is a sample dictionary file.
acquire
accidentally\t2.0
accommodate\t3.0
文本格式utf-8,#开头表示注释,被忽略
每个词一行,后面带权重
8.配置词典后在requestHandler中设置spellcheck.onlyMorePopular为true,能够根据权重排序
9.spellcheck.count返回行
配置完成重启服务后,设置参数suggest/?spellcheck.build=true来建立spellchecker的索引
而后输入:http://ip:port/corename/suggest?q=xxx进行搜索了
接下来就是前台js实现的问题了。
固然也能够经过solrj来进行搜索
CommonsHttpSolrServer server = new CommonsHttpSolrServer( "http://ip:port/corename/"); SolrQuery params = new SolrQuery(); String token = "牛"; params.set("qt", "/suggest"); params.set("q", token); params.set("spellcheck.build", "true"); QueryResponse response = null; try { response = server.query(params); System.out.println("查询耗时:" + response.getQTime()); } catch (SolrServerException e) { System.err.println(e.getMessage()); e.printStackTrace(); } catch (Exception e) { System.err.println(e.getMessage()); e.printStackTrace(); } finally { } SpellCheckResponse spellCheckResponse = response .getSpellCheckResponse(); if (spellCheckResponse != null) { List<Suggestion> suggestionList = spellCheckResponse .getSuggestions(); for (Suggestion suggestion : suggestionList) { System.out.println("Suggestions NumFound: " + suggestion.getNumFound()); System.out.println("Token: " + suggestion.getToken()); System.out.print("Suggested: "); List<String> suggestedWordList = suggestion.getAlternatives(); for (String word : suggestedWordList) { System.out.println(word + ", "); } System.out.println(); } }
这样就能够。
对于Suggest,我的的想法,字典是一种好的方式,可是增长字典比较麻烦,还有能够独立一个字段,对该字段作一些特殊的分词,好比像商品搜索类,整个标题能够是一个词,中文,数字,英文,符号等间隔的分开,这个具体仍是看应用了。
如今我在诚交网易货商品搜索上用的是字段的方式,新建一个单独的排序字段,而后把须要提示的字段拷贝过来,效果还算能够,你们能够上诚交网产品搜索体验一下。