文本分类的python实现-基于SVM算法

时间 2020-07-25

原文原文链接

描述训练集为评论文本，标签为 pos,neu,neg三种分类，train.csv的第一列为文本content，第二列为label。能够单独使用SVC训练而后预测，也能够使用管道pipeline把训练和预测放在一块。 SVC的惩罚参数C：默认值是1.0。C越大，对误分类的惩罚增大，趋向于对训练集全分对的状况，这样对训练集测试时准确率很高，但泛化能力弱。C值小，对误分类的惩罚减少，容许容错，泛化能力

>>阅读原文<<