咱们谈到“文本处理”时,咱们一般是指处理的内容。spa
Python 对文件对象的操做提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法能够接受一个变量以限制每次读取的数据量,但它们一般不使用变量。code
.read() 每次读取整个文件,它一般用于将文件内容放到一个字符串变量中。.read() 生成文件内容最直接的字符串表示,但对于连续的面向行的处理,它却没法实现,而且若是文件大于可用内存,则不可能实现这种处理。对象
.readline() 和 .readlines() 很是类似。它们都在相似于如下的结构中使用:blog
file = open('c:\\autoexec.bat') for line in file.readlines(): print(line)
.readline() 和 .readlines() 之间的差别是后者一次读取整个文件,象 .read() 同样。内存
.readlines() 自动将文件内容分析成一个行的列表,该列表能够由 Python 的 for ... in ... 结构进行处理。字符串
.readline() 每次只读取一行,一般比 .readlines() 慢得多,仅当没有足够内存能够一次读取整个文件时,才应该使用 .readline()。class