首先,廖雪峰老师的教程中解释了迭代器和生成器,这篇文章只是补充和我个人的总结。
什么是迭代
可以直接作用于for循环的对象统称为可迭代对象(Iterable)。
可以被next()函数调用并不断返回下一个值的对象称为迭代器(Iterator)。
所有的Iterable均可以通过内置函数iter()来转变为Iterator。
对迭代器来讲,有一个__next()就够了。在你使用for 和 in 语句时,程序就会自动调用即将被处理的对象的迭代器对象,然后使用它的next__()方法,直到监测到一个StopIteration异常。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
>>> L = [1,2,3] >>> [x**2 for x in L] [1, 4, 9] >>> next(L) Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'list' object is not an iterator >>> I=iter(L) >>> next(I) 1 >>> next(I) 2 >>> next(I) 3 >>> next(I) Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration |
上面例子中,列表L可以被for进行循环但是不能被内置函数next()用来查找下一个值,所以L是Iterable。
L通过iter进行包装后设为I,I可以被next()用来查找下一个值,所以I是Iterator。
题外话:
- 内置函数iter()仅仅是调用了对象的__iter()方法,所以list对象内部一定存在方法iter__()
- 内置函数next()仅仅是调用了对象的__next()方法,所以list对象内部一定不存在方法next__(),但是Itrator中一定存在这个方法。
- for循环内部事实上就是先调用iter()把Iterable变成Iterator在进行循环迭代的。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
>>> L = [4,5,6] >>> I = L.__iter__() >>> L.__next__() Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'list' object has no attribute '__next__' >>> I.__next__() 4 >>> from collections import Iterator, Iterable >>> isinstance(L, Iterable) True >>> isinstance(L, Iterator) False >>> isinstance(I, Iterable) True >>> isinstance(I, Iterator) True >>> [x**2 for x in I] [25, 36] |
4.Iterator继承自Iterable,从下面的测试中可以很方便的看到Iterator包含__iter()和next()方法,而Iteratble仅仅包含iter__()。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
>>> from collections import Iterator, Iterable >>> help(Iterator) Help on class Iterator: class Iterator(Iterable) | Method resolution order: | Iterator | Iterable | builtins.object |**注解:从这里可以看出Iterable继承自object, Iterator继承自Iterable。 | Methods defined here: | | __iter__(self) | | __next__(self) | Return the next item from the iterator. When exhausted, raise StopIteration ...... >>> help(Iterable) Help on class Iterable: class Iterable(builtins.object) | Methods defined here: | | __iter__(self) ...... |
iterable需要包含有__iter()方法用来返回iterator,而iterator需要包含有next__()方法用来被循环
如果我们自己定义迭代器,只要在类里面定义一个 iter() 函数,用它来返回一个带 next() 方法的对象就够了。
直接上代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
class Iterable: def __iter__(self): return Iterator() class Iterator: def __init__(self): self.start=-1 def __next__(self): self.start +=2 if self.start >10: raise StopIteration return self.start I = Iterable() for i in I: print(i) |
上面的代码实现的是找到10以内的奇数,代码中的类名可以随便取,不是一定需要使用我上面提供的类名的。
如果在Iterator的__next__方法中没有实现StopIteration异常,那么则是表示的全部奇数,那么需要在调用的时候设置退出循环的条件。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
class Iterable: def __iter__(self): return Iterator() class Iterator: def __init__(self): self.start=-1 def __next__(self): self.start +=2 return self.start I = Iterable() for count, i in zip(range(5),I): #也可以用内置函数enumerate来实现计数工作。 print(i) |
我们通过range来实现打印多少个元素,这里表示打印5个元素,返回结果和上面一致。
当然,我们可以把这两个类合并在一起,这样实现程序的简练。
最终版本如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
class Iterable: def __iter__(self): return self def __init__(self): self.start=-1 def __next__(self): self.start +=2 if self.start >10: raise StopIteration return self.start I = Iterable() for i in I: print(i) |
复制迭代器
迭代器是一次性消耗品,使用完了以后就空了,请看。
1 2 3 4 5 6 7 8 9 10 |
>>> L=[1,2,3] >>> I=iter(L) >>> for i in I: ... print(i, end='-') ... 1-2-3- >>>next(I) Traceback (most recent call last): File "<stdin>", |