SVM入门(三)线性分类器Part 2

上回说到对于文本分类这样的不适定问题(有一个以上解的问题称为不适定问题),须要有一个指标来衡量解决方案(即咱们经过训练创建的分类模型)的好坏,而分类间隔是一个比较好的指标。     在进行文本分类的时候,咱们可让计算机这样来看待咱们提供给它的训练样本,每个样本由一个向量(就是那些文本特征所组成的向量)和一个标记(标示出这个样本属于哪一个类别)组成。如:Di=(xi,yi)。xi就是文本向量(维数很
相关文章
相关标签/搜索