强悍的Python读取大文件的解决方案

这是一道著名的 Python 面试题,考察的问题是,Python 读取大文件和通常规模的文件时的区别,也即哪些接口不适合读取大文件。nginx

1. read() 接口的问题面试

f =open(filename, 'rb')
3d

f.read()对象

咱们来读取 1 个 nginx 的日至文件,规模为 3Gb 大小。read() 方法执行的操做,是一次性所有读入内存,显然会形成:blog

MemoryError接口

...内存

也即会发生内存溢出。ci

2. 解决方案:转换接口it

(1)readlines() :读取所有的行,构成一个 list,实践代表仍是会形成内存的问题;内存管理

forline inf.reanlines():

  ...

(2)readline():每次读取一行,

 

 

 

(3)read(1024):重载,指定每次读取的长度

 

 

 

3. 真正 Pythonic 的方法

真正 Pythonci 的方法,使用 with 结构:

 

 

 

对可迭代对象 f,进行迭代遍历:for line in f,会自动地使用缓冲IO(buffered IO)以及内存管理,而没必要担忧任何大文件的问题。

There should be one – and preferably only one – obvious way to do it.

做者:Python很简单连接:https://www.jianshu.com/p/560ff3adfee3

相关文章
相关标签/搜索