迭代器和生成器

发布时间 2024-01-04 15:15:51作者: 紫蕈

  1.可迭代对象

  2.迭代器

  3.生成器

1.可迭代对象

 

可迭代对象被分为三类:迭代器、序列和字典

迭代器是可迭代对象的一个子集,生成器是特殊的迭代器。

  • 可迭代对象需要实现__iter__方法
  • 迭代器不仅要实现__iter__方法,还需要实现__next__方法

简言之,可以直接作用于for循环的对象统称为可迭代对象:Iterable

可以使用isinstance()判断一个对象是否是Iterable对象:

from collections.abc import Iterable
>>>print(isinstance([], Iterable))
True
>>>print(isinstance({}, Iterable))
True
>>>print(isinstance((1,2,3), Iterable))
True
>>>print(isinstance('abc', Iterable))
True
>>>print(isinstance((i for i in range(6)), Iterable))
True
>>>print(isinstance(100, Iterable))
False

而生成器不但可以作用于for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值了。

 

2.迭代器

可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator

可以使用isinstance()判断一个对象是否是Iterator对象:

from collections.abc import Iterator

>>>print(isinstance([], Iterator))
False
>>>print(isinstance({}, Iterator))
False
>>>print(isinstance((1,2,3), Iterator))
False
>>>print(isinstance('abc', Iterator))
False
>>>print(isinstance((i for i in range(6)), Iterator))
True

生成器都是Iterator对象,但listdictstr虽然是Iterable,却不是Iterator

listdictstrIterable变成Iterator可以使用iter()函数:

from collections.abc import Iterator

>>>print(isinstance(iter([]), Iterator))
True
>>>print(isinstance(iter('abc'), Iterator))
True

 

3.生成器

创建生成器有两种方式:

  1. 创建生成器表达式,将列表生成式的 []换成()
  2. 在函数中增加yield,使函数变成生成器函数

生成器表达式:

L=[ i for i in range(6)]    #列表生成式
print(L)
结果:
[0, 1, 2, 3, 4, 5]

g=(i for i in range(6))     #生成器表达式
print(g)
结果:
<generator object <genexpr> at 0x0000018F12640580>

列表生成式打印的是列表,生成器表达式打印出的是<generator object <genexpr> at 0x0000018F12640580>

怎么打印生成器的每一个元素呢?使用next()函数

print(next(g))
print(next(g))
print(next(g))
print(next(g))
print(next(g))
print(next(g))
print(next(g))

结果:
0
1
2
3
4
5
Traceback (most recent call last):
  File "D:\pythonWorkspace\pySpace\example.py", line 555, in <module>
    print(next(g))
StopIteration
g=(i for i in range(6))生成器只有6个元素,0-5,但打印了7次,每次用next(g)返回下一个元素,当元素全部返回完,再使用next(g)就会抛出StopIteration异常
一般不采用这种不断调用next(g)的方式,而使用for循环进行迭代,使用for循环不用关心什么时候会出现StopIteration异常
g=(i for i in range(6))
for i in g:
    print(i)

结果:
0
1
2
3
4
5

 

生成器函数和普通函数执行方式不一样,生成器generator的运行如下:

  1. 当生成器函数被调用的时候,生成器函数不执行内部的任何代码,直接立即返回一个迭代器。
  2. 当所返回的迭代器第一次调用next的时候,生成器函数从头开始执行,如果遇到了执行yield x,next立即返回yield值x。
  3. 当所返回的迭代器继续调用next的时候,生成器函数从上次yield语句的下一句开始执行,直到遇到下一次执行yield
  4. 任何时候遇到函数结尾,或者return语句,抛出StopIteration异常

首先,如果你还没有对yield有个初步分认识,那么你先把yield看做“return”,这个是直观的,它首先是个return,普通的return是什么意思,就是在程序中返回某个值,返回之后程序就不再往下运行了。看做return之后再把它看做一个是生成器(generator)的一部分(带yield的函数才是真正的迭代器),好了,如果你对这些不明白的话,那先把yield看做return,然后直接看下面的程序,你就会明白yield的全部意思了:

def foo():
    print("starting...")
    while True:
        res = yield 4
        print("res:",res)
g = foo()
print(next(g))
print("*"*20)
print(next(g))
结果: starting...
4 ******************** res: None 4

代码说明:

  1.程序开始执行以后,因为foo函数中有yield关键字,所以foo函数并不会真的执行,而是先得到一个生成器g(相当于一个对象)
  2.直到调用next方法,foo函数正式开始执行,先执行foo函数中的print方法,然后进入while循环
  3.程序遇到yield关键字,然后把yield想想成return,return了一个4之后,程序停止,并没有执行赋值给res操作,此时next(g)语句执行完成,所以输出的前两行(第一个是while上面的print的结果,第二个是return出的结果)是执行print(next(g))的结果,
  4.程序执行print("*"*20),输出20个*
  5.又开始执行下面的print(next(g)),这个时候和上面那个差不多,不过不同的是,这个时候是从刚才那个next程序停止的地方开始执行的,也就是要执行res的赋值操作,这时候要注意,这个时候赋值操作的右边是没有值的(因为刚才那个是return出去了,并没有给赋值操作的左边传参数),所以这个时候res赋值是None,所以接着下面的输出就是res:None,
  6.程序会继续在while里执行,又一次碰到yield,这个时候同样return 出4,然后程序停止,print函数输出的4就是这次return出的4.

 

到这里你可能就明白yield和return的关系和区别了,带yield的函数是一个生成器,而不是一个函数了,这个生成器有一个函数就是next函数,next就相当于“下一步”生成哪个数,这一次的next开始的地方是接着上一次的next停止的地方执行的,所以调用next的时候,生成器并不会从foo函数的开始执行,只是接着上一步停止的地方开始,然后遇到yield后,return出要生成的数,此步就结束。

 

再看一个这个生成器的send函数的例子:

def foo():
    print("starting...")
    while True:
        res = yield 4
        print("res:",res)
g = foo()
print(next(g))
print("*"*20)
print(g.send(7))

结果: starting...
4 ******************** res: 7 4

先大致说一下send函数的概念:此时你应该注意到上面那个的紫色的字,还有上面那个res的值为什么是None,这个变成了7,到底为什么,这是因为,send是发送一个参数给res的,因为上面讲到,return的时候,并没有把4赋值给res,下次执行的时候只好继续执行赋值操作,只好赋值为None了,而如果用send的话,开始执行的时候,先接着上一次(return 4之后)执行,先把7赋值给了res,然后执行next的作用,遇见下一回的yield,return出结果后结束。

 

 代码说明:

  5.程序执行g.send(7),程序会从yield关键字那一行继续向下运行,send会把7这个值赋值给res变量

  6.由于send方法中包含next()方法,所以程序会继续向下运行执行print方法,然后再次进入while循环

  7.程序执行再次遇到yield关键字,yield会返回后面的值后,程序再次暂停,直到再次调用next方法或send方法。

 

本文参考:

https://www.liaoxuefeng.com/wiki/1016959663602400/1017318207388128

https://blog.csdn.net/this_is_me_anyway/article/details/88668415