【学习笔记】自然语言处理实践(新闻文本分类)- 数据读取与分析

Datawhale零基础入门NLP赛事-Task2 数据读取 数据分析 作业 本笔记是参加Datawhale零基础入门NLP赛事的学习笔记。 数据读取 数据分析 文本长度分布 结论:文本的平均长度为907个字符,最长的文本有57921个字符,最短的只有两个。 文本长度直方图 结论:由图可见,绝大多数的文本长度不超过1w字符。 类别分布 结论:由上图可以得出,数量最多的是0(科技)类的文本,最少的是
相关文章
相关标签/搜索