Python:range 对象并非迭代器

简评:迭代器(iterator)是惰性可迭代对象(lazy iterable),range 函数在 Python 3 中是一个惰性的可迭代对象,那么 range 是否是迭代器呢?为何。

TLNR:Python 3 中的 range 对象(Python 2 中的 xrange 对象)是 lazy 的,但 range 对象却不是迭代器。函数

是的,这让人很困惑spa

当谈论 Python 中的迭代器(iterator)和可迭代对象(iterable)时,你极可能会听到有人重复 range 是迭代器的误解。我认为这是很是严重误解, 若是你认为 range 对象是迭代器,那么你关于「迭代器是如何运行」的心智模型还不够清楚。从某种意义上来讲,range 和迭代器都是「惰性」的,但它们是以至关不一样的方式实现「惰性」的。3d

什么是迭代器(iterator)orm

在 Python 中,可迭代对象就是你能够迭代的任何东西,而迭代器就是实际迭代的东西。对象

Iter-ables are able to be iterated over. Iter-ators are the agents that perform the iteration.blog

可使用 iter 函数从任何可迭代对象中获取迭代器:索引

v2-5c6a74aee26f6000cdf59c5cff9e6be7_hd.jpg

一旦有了迭代器,能够用它作的惟一的事情就是得到它的下一个元素:ip

v2-457a2ef4f3b2d41e2e65e9ecffe4850f_hd.jpg

若是没有更多的元素了, 则会抛出一个 stop iteration exception:
v2-9db33f878c7daa726b6faa9556b508fd_hd.jpg内存

全部的迭代器都是可迭代对象,意思是你能够从一个迭代器中获得一个迭代器,所以你能够遍历一个迭代器:
v2-00d858b0b6e1c45e4c738d08030b7835_hd.jpg字符串

应该指出的是迭代器是有状态的,在循环遍历一次迭代器后,若是尝试再次循环,它将为空:
v2-1e45994d0fd5026a1c44582fe8fd878d_hd.jpg

在 Python 3 中,enumerate、zip、reversed和其余一些内置函数会返回迭代器:
v2-909b4d6c59cc33b0de601820413ae07f_hd.jpg

生成器(不管来自生成器函数仍是生成器表达式)是一种建立迭代器的简单方法:

v2-676b42cca58d835e0ff52f3e071fcaa4_hd.jpg

我常常说迭代器是惰性的一次性可迭代对象。 「惰性」是由于他们只循环计算项目,「单次使用是由于一旦从一个迭代器中「消费」了一个元素以后,这个元素就永远消失了。

什么是 range

Python 3 中的 range 对象(Python 2 中的 xrange)能够像任何其余可迭代对象同样循环使用:

v2-7574370bc89e9660ce3699a8646308d6_hd.jpg

由于 range 是可迭代对象,因此能够从中获得一个迭代器:
v2-651204338fff390d9ae2c65e00d89400_hd.jpg

但 range 对象自己不是迭代器,咱们不能在 range 对象上调用 next:
v2-424b5fd5829606435d555049dd363c1d_hd.jpg

与迭代器不一样的是,咱们能够遍历一个 range 对象而不「消耗」它:
v2-c5866adb37ed828ebd7ef1bcc6c26bc5_hd.jpg

若是咱们使用迭代器完成此操做,则第二次循环时不会获得任何元素:
v2-3bad586b4166e1b1d7fe701e0f0ae2c9_hd.jpg

宗上,与 zip, enumerate, or generator对象不一样,range 对象不是迭代器。

那么,究竟 range 是什么

range 对象在某种意义上是「惰性的」,由于它不会生成建立时包含的每一个数字,相反,当咱们在循环中须要的时候,它才将这些数字返回给咱们。

下面是一个 range 对象和一个生成器(是一种迭代器):

v2-539d05e0d493d8887575da154f6c8625_hd.jpg

不像生成器,range 对象有长度:
v2-3a027025e54cd25b58527f090dcf6923_hd.jpg

而且能够被索引:
v2-50bba0bb62a1966957b39deb3837a789_hd.jpg

与迭代器不一样,你能够询问他们是否包含某元素而不改变他们的状态:
v2-2e2ec3cbbe0c5d31a9caa98a026959d8_hd.jpg

若是你想要一个 range 对象的描述,能够称它们为懒序列,range 是序列(如列表,元组和字符串),但并不包含任何内存中的内容,而是经过计算来回答问题。
v2-f7a70f3f4e10092e47baf4c3ec32723c_hd.jpg

为何这个区别很重要

若是我告诉你某个对象是一个迭代器,你会知道当在这个对象上调用 iter 函数时,总会获得相同的的对象(按照定义):
v2-3a90773c3f5d2a7dd2a0028cc852e248_hd.jpg

确信能够在这个对象上调用 next 函数,由于能够在全部的迭代器上调用 next 函数:
v2-f138954eebdd1381d44389640a9ede26_hd.jpg

并且你会知道,当遍历它时,这些元素将从迭代器中被消耗掉,有时候这个特性能够派上用场(以特殊的方式处理迭代器):
v2-5af6ee56305dbdc431752829e5e4a44e_hd.jpg

因此虽然看起来「惰性可迭代对象」和「迭代器」之间的区别很微妙,但这些术语确实意味着不一样的东西。 虽然「惰性可迭代对象」是一个没有具体含义的很是广泛的术语,但「迭代器」这个词意味着一个具备很是特定行为的对象。

总结

若是你知道你能够循环遍历某个对象,这是一个可迭代对象(iterable)。

若是你知道你正在循环遍历的对象是在循环的时候计算出来,那么这是一个惰性可迭代对象(lazy iterable)。

若是你知道你能够传递一些东西给 next 函数,它就是一个迭代器(这是最多见的惰性可迭代对象)。

若是你能够循环屡次而不用「耗尽」它,它不是一个迭代器。若是你不能将某些东西传递给 next 函数,那么它不是一个迭代器。 Python 3 的 range 对象不是迭代器。 若是你正在指导别人关于 range 对象的知识,请不要使用「迭代器」一词,这会让人十分困惑,并可能致使他人开始滥用「迭代器」这个词。

原文:Python: range is not an iterator!

相关文章
相关标签/搜索