统计自然语言处理--文本分类

文本表示 文本表示有向量空间模型,词组表示法,概念表示法 目前文本通常采用向量空间模型表示 文档 特征项 可以是词,短语,文档可以看成是特征集合 特征项的权重,文档可以用其含有的特征项以及特征项的权重表示 ( 向量空间模型( VSM) ) 给定一个文档D( t1, w1;t2, w2;…;tn, wn) , D符合以下两条约定: ( 1) 各个特征项tk( 1≤k≤n) 互异( 即没有重复) (
相关文章
相关标签/搜索