中文分词原理--正向最大匹配

转载原文:http://hxraid.iteye.com/blog/667134    中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。   在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法 (Ma
相关文章
相关标签/搜索