中文分词 《第七篇》

中文分词 《第七篇》 1、分词的方法   分词的方法主要有如下几种:html   一、单字切分算法   单字切分就是把一段文字按照每一个字去创建索引。api   若是用来切分“我爱你伟大的中国”,就会切成“我”,“爱”,“你”,“伟”,“大”,“的”,“中”,“国”。这种分词效率低,但也能解决一些问题,聊胜于无。post   二、二分法测试   二分法就是把一段文字的每两个相邻的字算做一个词。一样
相关文章
相关标签/搜索