如何用机器学习对文本分类

时间 2021-01-12

原文原文链接

需求使用监督学习对历史数据训练生成模型，用于预测文本的类别。样本清洗主要将重复的数据删除掉，将错误无效的数据纠正或删除，并检查数据的一致性等。比如我认为长度小于少于13的数据是无效的遂将之删掉。 def writeFile(text): file_object = open('result.txt','w') file_object.write(text) file_obj