DataWhale 零基础入门NLP赛事-新闻文本分类 TASK2 数据读取与数据分析

Task2 数据读取与数据分析

赛题:零基础入门NLP赛事-新闻文本分类
地址:新闻文本分类

学习目标

  • 学习使用pandas读取赛题数据
  • 分析赛题数据的分布规律

数据读取

该数据是以csv格式进行存储的,使用pandas完成数据读取操作
在这里插入图片描述
read_csv:

  • filepath:文件路径
  • sep:分隔符,制定没每列的分隔符
  • nrows:一次读取多少条文件,由于数据集较大,先设置读取100条数据
    在这里插入图片描述