智源&计算所-互联网虚假新闻检测挑战赛

赛题的分析(Task 1): 一、任务:给定一个新闻事件的文本,断定该事件属于真实新闻仍是虚假新闻。 二、方法:训练一个二分类器,判别新闻是真仍是假。 1、数据预处理: a、样本数据观察: 训练集有38471条数据,每条数据有id、text、label三个字段,其中1表明正例 (真),0表明负例(假) b、数据清洗: 一、生成训练词向量的数据 二、去掉训练样本里的无心义的噪音,例如:url、@+人
相关文章
相关标签/搜索