文本特征抽取的向量空间模型(VSM)和TF/IDF方法

文本特征抽取 两组小说,一组是爱情的,另一组是科幻的。我们能否用支持向量机训练一个模型,用来识别小说类型呢? 这个并不容易。因为支持向量机这类机器学习算法只能接受数学里面的向量作为输入。如果用它来做文本分类,必须先把文本转化成向量才行。这就是涉及到一个很重要的话题,如何把文本转化成向量? 把文本转化成数学模型,是用数学方法处理文本的先决条件,这个过程称为文本特征抽取。向量作为一种基本的数学模型,是
相关文章
相关标签/搜索