lucene分词部分源码阅读-分词流程

分词入口:子类调用 Analyzer.totkenStream(String fieldName,Read read)。构建分词器,读入待分词文本。 子类中实现createComponents方法 将需要的Tokenizer,及Filter传入TokenStreamComponents , TokenStreamComponents是Analyzer的内部类。 返回对象为包装了Tokenizer的
相关文章
相关标签/搜索