【7.0】Python高级之生成器

发布时间 2023-11-20 12:39:12作者: Chimengmeng

【一】什么是生成器?

  • Python中的生成器是一种特殊的迭代器,可以在需要时生成数据,而不必提前从内存中生成并存储整个数据集。
  • 通过生成器,可以逐个生成序列中的元素,而无需一次性生成整个序列。
  • 生成器在处理大数据集时,具有节省内存、提高效率的特点。

【二】生成器有两种创建方式

【1】列表推导式

  • 使用列表推导式时,可以将列表推导式的方括号改为圆括号,即可创建一个生成器。
# 列表生成式生成列表
start_list = [x * 2 for x in range(5)]

print(start_list)
# [0, 2, 4, 6, 8]

# 将列表改成元祖,看起来像元祖推导式,其实是一个生成器对象
G = (x * 2 for x in range(5))

print(G)
# <generator object <genexpr> at 0x000001873491CC80>

# 生成器对象可以强转成列表
print(list(G))
# [0, 2, 4, 6, 8]
  • 怎么打印出生成器的每一个元素呢?
    • 如果要一个一个打印出来,可以通过 next() 函数获得生成器的下一个返回值
  • 生成器保存的是算法
    • 每次调用 next(G) ,就计算出 G 的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出 StopIteration 的异常。
    • 当然,这种不断调用 next() 实在是太变态了,正确的方法是使用 for 循环,因为生成器也是可迭代对象。
    • 所以,我们创建了一个生成器后,基本上永远不会调用 next() ,而是通过 for 循环来迭代它,并且不需要关心 StopIteration 异常。
# 将列表改成元祖,看起来像元祖推导式,其实是一个生成器对象
G = (x * 2 for x in range(5))

# 生成器本身就是一种迭代器 , 可以for 遍历生成器对象
for i in G:
    print(i)

# 0
# 2
# 4
# 6
# 8

【2】yield关键字

(1)yield关键字介绍

  • 使用yield关键字定义一个生成器函数时,生成器函数中的yield语句会暂停函数执行并返回一个值,下一次调用该函数时会继续执行并返回下一个值。
def my_generator():
    yield 1
    yield 2
    yield 3

g = my_generator()
print(next(g))  # 输出:1
print(next(g))  # 输出:2
print(next(g))  # 输出:3

  • 在上面的代码中,my_generator()是一个生成器函数,通过yield关键字逐个生成值。
  • 在调用该函数时,会得到一个生成器对象。
  • 通过调用next()函数,可以逐个返回生成器中的值。

(2)yield关键字使用

  • 在函数内可以采用表达式形式的yield
def eater():
    print('开始吃饭 ovo ')
    while True:
        food = yield
        print(f'得到的食物是 :>>>> {food}, 开始吃饭喽 :>>>> {food}')
  • 可以拿到函数的生成器对象持续为函数体send值
# 定义生成器
def eater():
    print('开始吃饭 ovo ')
    while True:
        food = yield
        print(f'得到的食物是 :>>>> {food}, 开始吃饭喽 :>>>> {food}')


# 得到生成器对象
food_eater = eater()

# 需要事先”初始化”一次,让函数挂起在food=yield,等待调用food_eater.send()方法为其传值

# food_eater.send(None)
# 等同于
next(food_eater)

# 开始吃饭 ovo

food_eater.send('包子')
# 得到的食物是 :>>>> 包子, 开始吃饭喽 :>>>> 包子

food_eater.send('鸡腿')
# 得到的食物是 :>>>> 鸡腿, 开始吃饭喽 :>>>> 鸡腿
  • 编写装饰器来完成为所有表达式形式yield对应生成器的初始化操作
# 定义初始化装饰器
def init(func):
    def wrapper(*args, **kwargs):
        g = func(*args, **kwargs)
        next(g)
        return g

    return wrapper


# 定义生成器 并 使用装饰器初始化
@init
def eater():
    print('开始吃饭 ovo ')
    while True:
        food = yield
        print(f'得到的食物是 :>>>> {food}, 开始吃饭喽 :>>>> {food}')


print("得到生成器对象之前")
# 得到生成器对象
food_eater = eater()
print("得到生成器对象之后")

# 得到生成器对象之前
# 开始吃饭 ovo 
# 得到生成器对象之后

food_eater.send('包子')
# 得到的食物是 :>>>> 包子, 开始吃饭喽 :>>>> 包子

food_eater.send('鸡腿')
# 得到的食物是 :>>>> 鸡腿, 开始吃饭喽 :>>>> 鸡腿
  • 表达式形式的yield也可以用于返回多次值
def eater():
    print('开始做饭 ovo ')
    food_list = []
    while True:
        food = yield food_list
        food_list.append(food)
        print(f"做饭喽 :>>>> {food_list}")


# 得到生成器对象
food_eater = eater()

next(food_eater)
# 开始做饭 ovo

food_eater.send('包子')
# 做饭喽 :>>>> ['包子']

food_eater.send('鸡腿')
# 做饭喽 :>>>> ['包子', '鸡腿']

【三】yield+next详解

  • 若函数体包含yield关键字,再调用函数,并不会执行函数体代码,得到的返回值即生成器对象
def my_range(start, stop, step=1):
    print('start...')
    while start < stop:
        yield start
        start += step
    print('end...')


g = my_range(0, 3)
print(g) # <generator object my_range at 0x0000019958788430>
  • 生成器内置有__iter____next__方法
  • 所以生成器本身就是一个迭代器
def my_range(start, stop, step=1):
    print('start...')
    while start < stop:
        yield start
        start += step
    print('end...')


g = my_range(0, 3)
print(g)  # <generator object my_range at 0x00000179B0912A40>
print(g.__iter__)  # <method-wrapper '__iter__' of generator object at 0x000002AFE95A8430>
print(g.__next__)  # <method-wrapper '__next__' of generator object at 0x000002AFE95A8430>

# 生成方式一
g_iter = iter(g)
print(g_iter)  # <generator object my_range at 0x00000288EAEE22D0>
# start...
print(next(g_iter))
# 0
print(next(g_iter))
# 1
def my_range(start, stop, step=1):
    print('start...')
    while start < stop:
        yield start
        start += step
    print('end...')


g = my_range(0, 3)
print(g)  # <generator object my_range at 0x00000179B0912A40>
print(g.__iter__)  # <method-wrapper '__iter__' of generator object at 0x000002AFE95A8430>
print(g.__next__)  # <method-wrapper '__next__' of generator object at 0x000002AFE95A8430>

# 生成方式二
print(next(g)) 
# start...
print(next(g))
# 0
print(next(g))
# 1
  • next原理详解
def my_range(start, stop, step=1):
    print('start...')
    while start < stop:
        yield start
        start += step
    print('end...')


g = my_range(0, 3)
print(g)  # <generator object my_range at 0x00000179B0912A40>
print(g.__iter__)  # <method-wrapper '__iter__' of generator object at 0x000002AFE95A8430>
print(g.__next__)  # <method-wrapper '__next__' of generator object at 0x000002AFE95A8430>


# 触发函数执行直到遇到yield则停止,将yield后的值返回,并在当前位置挂起函数
print(f"第一次 :>>>> {next(g)}")
# start...
# 第一次 :>>>> 0

# 再次调用next(g),函数从上次暂停的位置继续执行,直到重新遇到yield...
print(f"第二次 :>>>> {next(g)}")
# 第二次 :>>>> 1

# 周而复始...
print(f"第三次 :>>>> {next(g)}")
# 第三次 :>>>> 2
# end...

print(f"第四次 :>>>> {next(g)}")
'''
Traceback (most recent call last):
  File "E:\PythonProjects\生成器.py", line 33, in <module>
    print(f"第四次 :>>>> {next(g)}")
StopIteration
'''

【四】生成器的特点

  • 节约内存
  • 迭代到下一次的调用时,所使用的参数都是第一次所保留下的
  • 即是说,在整个所有函数调用的参数都是第一次所调用时保留的,而不是新创建的