中文分词和TF-IDF

转自月光博客:http://www.williamlong.info/archives/1839.html php  中文分词(Chinese Word Segmentation)指的是将一个汉字序列切分红一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,能够达到电脑自动识别语句含义的效果。html   TF-IDF(term frequency–inverse
相关文章
相关标签/搜索