令笔者对pandas印象最为深入的一件事,就是在pandas中已经内置了不少数据导入导出方法,然而本人并不了解,在一次小项目的工做中曾手写了一个从excel表格导入数据到DataFrame的python脚本。这个糗事让笔者深感代码能力急需增强!html
为了让那次教训刻骨铭心,也为了不广大读者再走相似的弯路,本文主要介绍关于pandas的数据导入导出功能,理解起来很是简单。
pandas支持的导入导出数据格式多种多样,有csv,excel,sql,json,html,pickle等。
虽然支持众多数据格式,但各种数据格式导入导出的操做方法千篇一概,了解其中一个便能掌握所有,于是本文以数据分析中常见的csv格式为例,介绍pandas的数据导入导出功能。python
例中,要读取的csv文件与代码程序在同一目录下:sql
exam.csv文件内容以下:json
程序将csv文件读入到data变量中:函数
从中能够看到:pandas默认会将csv文件的第一行做为列名导入进来。excel
若是导入的数据文件中没有保存列名,则在导入时能够手动添加列名,示例以下:htm
先复制一份上述csv文件,去掉原有列名部分,其他不变:
blog
在读入数据时,指定列名:
索引
为方便起见,咱们将刚才读入的数据再次导出到同目录下的daochu.csv文件:数据分析
查看daochu.csv文件中的内容:
能够看到:导出时选择了三列数据,而且输出列名(header=True)与行索引(index=True),索引默认是“0,1,2,3”的形式。 导出csv文件函数的参数比较多,能够对导出后的文件内容进行多种设定,具体每个参数的做用效果还要靠诸位亲自探索。