读写文件是最多见的IO操做。python
在磁盘上读写文件的功能都是由操做系统提供的,读写文件就是请求操做系统打开一个文件对象(一般称之为文件描述符),而后,经过操做系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。windows
读文件:缓存
read([size]):读取文件(读取size字节,默认读取所有) readline([size]):读取一行 readlines([size]) :读取缓冲buf(io.DEFAULT_SET_BUFFER),返回每一行所组成的列表 iter:使用迭代器遍历读取文件 f.open(name);iter_f = iter(f);用for line in iter_f循环迭代器
要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传人文件名和标识符。函数
>>> f = open('/opt/test.txt','r')
标识符'r'表示读,若是文件不存在,open()函数就会抛出一个FileNotFoundError的错误,并提示文件不存在。测试
>>> f = open('test.txt','r') Traceback (most recent call last): File "D:/Users/练习.py", line 305, in <module> f = open('test.txt','r') FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'
文件打开成功,则调用read()方法能够一次读取文件的所有内容,Python把内容读到内存,用str对象表示:close()方法关闭文件。文件使用完必须关闭,由于文件对象会占用操做系统的资源,而且操做系统同一时间能打开的文件数量是有限的。编码
f = open('test.txt','r') print(f.read()) f.close() hello world
使用with语句能够来自动帮咱们调用close()方法。操作系统
with open('test.txt','r') as f: print(f.read()) hello world
调用read()会一次性读取文件的所有内容,若是文件过大,内存就爆了,因此,保险起见,能够反复调用read(size)方法,每次最多读取size个字节的内容。另外,readline()能够每次读取一行的内容,调用readlines()一次读取全部内容并按行返回list。指针
若是文件太小,read()一次性读取最方便,若是不能肯定文件大小,能够反复调用read(size)比较保险,若是是配置文件,调用readlines()最方便。code
for line in f.readlines(): print(line.strip()) # 把末尾的\n去除
二进制文件视频
要读取二进制文件,如图片、视频等,用‘rb’模式打开文件
with open('test.txt','rb') as f: print(f.read()) b'hello world\r\n\xe5\x88\xa4'
字符编码
windows下默认编码是gbk模式,要读取utf-8编码的文本文件,须要给open()函数传人encoding参数
with open('test.txt','r',encoding='utf8') as f: print(f.read()) hello world 判断下列
遇到编码不规范的文件,可能会碰到UnicodeDecodeError,这是因为文本文件中可能夹杂了一些非法编码的字符,open()函数还接收了一个errors参数,表示若是遇到编码错误后如何处理,最简单的方式就是直接忽略。
with open('test.txt','r',encoding='utf8',errors='ingore') as f: print(f.read())
写文件:
write(str):将字符串写入文件 writelines(sequence_of_strings):写多行到文件,参数为可迭代的对象
flush() 将存放再内存中的内容写入硬盘。
当调用write()时,Python解释器调用系统想把内容写到磁盘,但Linux内核有文件缓冲机制,因此会缓存到内核的缓存区,当调用close()或者flush()时才会把内容写到文件。或者写入数据量大于或等于写缓存,写缓存也会同步到磁盘上。
写文件和读文件同样,都是调用open()函数,惟一区别就是标识符的传人,'w',或者'wb'来表示写文本文件或者写二进制文件。
with open('t.txt','w') as f_w: f_w.write('hello world')
写入文件如不存在时,会直接建立该文件并进行写入操做。若是文件里面又内容时,会覆盖掉原有的文件。
追加文件内容则能够传入'a'参数。
文件指针的操做:
seek(offset[,whwence]) 移动文件指针 # offset 偏移量,能够为负数。 whenc 偏移相对位置。有三种移动方式0,1,2,其中1和2必须在b模式下进行,但不管哪一种模式,都是以bytes为单位移动的 tell 打印指针所在位置 truncate是截断文件,因此文件的打开方式必须可写,可是不能用w或w+等方式打开,由于那样直接清空文件了,因此truncate要在r+或a或a+等模式下测试效果。