文本分类的python实现-基于SVM算法

描述 训练集为评论文本,标签为 pos,neu,neg三种分类,train.csv的第一列为文本content,第二列为label。能够单独使用SVC训练而后预测,也能够使用管道pipeline把训练和预测放在一块。 SVC的惩罚参数C:默认值是1.0。C越大,对误分类的惩罚增大,趋向于对训练集全分对的状况,这样对训练集测试时准确率很高,但泛化能力弱。C值小,对误分类的惩罚减少,容许容错,泛化能力
相关文章
相关标签/搜索