零基础入门NLP - 新闻文本分类(赛题理解)

本文是零基础入门NLP - 新闻文本分类的第一篇作业,定位是对赛题的精简和解题思路开拓。 读题 任务 新闻文本分类。 数据解析 赛题数据为新闻文本,并按照字符级别进行匿名处理。 数据类别为14种:财经、**、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。 数据量:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。 模型评价 评价标准为类别 F
相关文章
相关标签/搜索