text mining week5学习笔记

一、 文本分类 1. 判别分类器 (1) logestic回归 (2) knn分类 如要求正中间那个四方格属于哪个分类,则先要确定k的值,若设k=1,则归为距它最近的一个类。若k=4,如图圈中会看到玫红方格所占概率3/4,点方格为1/4,则归为玫红方格的类中. (3) SVM 尽力使分开的两个类别有最大的间隔,这样才使得分类具有更高的可信度,而且对于未知的新样本才有很好的分类预测能力。 有些时候分
相关文章
相关标签/搜索