#Datawhale_NLP Task01赛题理解

赛题理解 赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。 赛题数据由以下几个部分构成: 训练集20w条样本 测试集A包括5w条样本 测试集B包括5w条样本 问题 不太明白按照字符级别进行匿名处理是什么意思? 任务:训练分类器 目标是把训练集中20万的文本尽可能精确地归为14
相关文章
相关标签/搜索