Python的文件是一个重要的对象,使用open()函数来打开文件,建立文件对象,进行文件的读写操做。当数据用于交换信息时,一般须要把数据保存为有格式的文本数据,能够保存为有特定的行分隔符和列分隔符的数据,这能够使用pandas模块中的函数来读写;也能够保存为json结构的数据,这能够使用json模块中的函数来实现;对于大型的数据交互,一般使用数据库。html
open()函数用于打开文件,建立文件对象:python
open(name, mode, encoding=None)
参数注释:正则表达式
name是文件名,包括路径数据库
encoding 是编码方式,经常使用的编码方式是utf-8json
mode是打开文件的模式,最经常使用的模式是:函数
open()函数建立一个file 对象,文件对象的主要方法:编码
1,读取文件spa
调用open()函数打开一个文件,设置mode='r',表示打开文件是为了读取文件中的数据,调用文件对象的函数或迭代器来逐行读取数据:.net
file = open('test.txt','r',encoding='utf-8') lines = [line.strip() for line in file] file.close()
注意:打开文件以后,完成文件的读写以后,必须调用文件对象的close()方法,最终关闭文件。code
2,写入文件
调用open()函数打开一个文件,若是设置mode='w',那么表示打开文件是为了向文件中写入数据,调用文档对象的write('content')函数向文档中写入内容。
file = open('test.txt','w',encoding='utf-8') file.write('write content to file') file.close()
注意:打开文件以后,完成文件的读写以后,必须调用文件对象的close()方法,最终关闭文件。
3,文件的关闭
调用open()函数打开一个文件,是把文件读取到内存中的,若是不及时关闭文件,文件对象就会一直占用系统资源,除了调用文件对象的close()方法关闭文件以外,还能够使用 with open(),由系统自动关闭文件:
with open('test.txt','r',encoding='utf-8') as file: lines = [line.strip() for line in file]
pandas模块提供了一些用于把表格型数据读取为DataFrame对象的函数。
1,格式化数据的读取
read_csv:从文件、URL、文件型对象中加载带分隔符的数据,默认的分隔符是逗号。
read_table:从文件、URL、文件型对象中加载带分隔符的数据,默认的分隔符是制表符(\t)。
参数注释:
2,输出数据
利用DataFrame的to_csv方法,能够把数据写到一个以逗号分隔的文件中
DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True, escapechar=None, decimal='.')
经常使用参数注释:
Python中的json对象实际是一个字典结构,用于存储和交换信息,导入json模块:
import json
1,把字符串转换为json
json的load()方法用于把josn格式的字符串转换为json对象,这其实是一个字典结构:
json_string= '{ "name":"John", "age":30, "city":"New York"}' # parse string to json json_obj = json.loads(json_string)
2,把字典转换为json字符串
json的dumps()函数用于把字典结构转换为json格式的字符串。
x = { "name": "John", "age": 30, "city": "New York" } # convert dict into JSON string: json_string = json.dumps(x)
参考文档: