天池NLP新闻文本分类学习赛心得-Task2

天池NLP新闻文本分类学习赛心得-Task2 赛题链接:https://tianchi.aliyun.com/competition/entrance/531810/introduction 今天按照昨天的存储方法后,再次读取数据相比昨天耗时就小的多了,并对文本数据进行初步处理及分析。 先来探究每条文本长度分布如何: 可以看到总共统计了20w条文本数据记录,其中最长的有57921个字符,最短的只有
相关文章
相关标签/搜索