迭代器与生成器

发布时间 2023-12-22 12:17:44作者: 善战者求之于势

一、迭代器与生成器的概念

迭代器(Iterator)和生成器(Generator)在 Python 中都用于处理序列数据,但它们有一些重要的区别。以下是迭代器和生成器的主要区别:

迭代器(Iterator)

定义方式: 迭代器是一个实现了 __iter__()__next__() 方法的对象。__iter__() 方法返回迭代器对象自身,而 __next__() 方法用于返回序列中的下一个元素。

状态: 迭代器维护了一个内部状态,用于记录序列中当前位置的元素。每次调用 __next__() 方法时,迭代器会返回下一个元素,并更新其内部状态。

使用方式: 可以通过内置函数 iter() 创建迭代器对象,然后使用 next() 函数逐个获取序列中的元素。

生成器(Generator)

定义方式: 生成器是通过函数中包含 yield 关键字定义的。当调用生成器函数时,它返回一个迭代器对象,每次执行 yield 语句时都会暂停函数的执行并返回一个值。

状态: 生成器函数执行时会保留局部变量的状态,使得在每次调用 next() 方法时都能够从上次的执行点继续执行。

单向: 生成器是单向的,只能按照定义的顺序前进,不支持回退。一旦生成器函数执行完毕,再次调用 next() 将引发 StopIteration 异常。

使用方式: 生成器可以使用函数的方式定义,通过 yield 返回值,而不是一次性生成整个序列。可以使用 for 循环或 next() 函数逐个获取生成器的值。

共同点

按需生成值: 迭代器和生成器都是按需生成值的,可以在需要时逐个获取元素,而不是一次性生成整个序列。

用于循环结构: 迭代器和生成器都可以被用于 for 循环结构,使得处理序列数据更加方便。

节省内存: 由于按需生成,迭代器和生成器在处理大型数据集时可以节省内存。

综合而言,迭代器和生成器都是处理序列数据的强大工具,选择使用哪个取决于具体的需求和代码结构。

二、使用案例

2.1 迭代器

迭代是 Python 最强大的功能之一,是访问集合元素的一种方式。。

迭代器是一个可以记住遍历的位置的对象。

迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。

迭代器有两个基本的方法:iter()next()

字符串,列表或元组对象都可用于创建迭代器:

>>> list=[1,2,3,4]
>>> it = iter(list)    # 创建迭代器对象
>>> print (next(it))   # 输出迭代器的下一个元素
1
>>> print (next(it))
2
>>> 

迭代器对象可以使用常规 for 语句进行遍历:

#!/usr/bin/python3

list=[1,2,3,4]
it = iter(list)    # 创建迭代器对象
for x in it:
    print (x, end=" ")

执行以上程序,输出结果如下:

1 2 3 4

也可以使用 next() 函数:

#!/usr/bin/python3

import sys         # 引入 sys 模块

list=[1,2,3,4]
it = iter(list)    # 创建迭代器对象

while True:
    try:
        print (next(it))
    except StopIteration:
        sys.exit()

执行以上程序,输出结果如下:

1
2
3
4

2.2 生成器

在 Python 中,使用了 yield 的函数被称为生成器(generator)。

跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。

在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值。并在下一次执行 next() 方法时从当前位置继续运行。

以下实例使用 yield 实现斐波那契数列:

#!/usr/bin/python3

import sys

def fibonacci(n): # 生成器函数 - 斐波那契
    a, b, counter = 0, 1, 0
    while True:
        if (counter > n): 
            return
        yield a
        a, b = b, a + b
        counter += 1
f = fibonacci(10) # f 是一个迭代器,由生成器返回生成

while True:
    try:
        print (next(f), end=" ")
    except StopIteration:
        sys.exit()

执行以上程序,输出结果如下:

0 1 1 2 3 5 8 13 21 34 55

三、使用场景

3.1 使用生成器的场景

  1. 大数据集处理: 当处理大量数据时,生成器允许按需生成数据,而不需要一次性将所有数据加载到内存中。这对于内存敏感的应用程序非常有用。
  2. 惰性计算: 如果你有一个计算密集型的操作,但只有在需要结果时才进行计算,生成器可以提供惰性计算的特性,避免不必要的计算开销。
  3. 无限序列: 生成器可以轻松地表示无限序列,因为它们按需生成数据。这对于模拟、数学计算和其他需要无限序列的场景非常有用。
  4. 协程和异步编程: 生成器可以用作协程的基础,用于异步编程中。asyncio 模块中就使用了异步生成器。
  5. 状态机: 生成器可以方便地实现状态机,使得在状态之间切换更加直观和简单。

3.2 使用迭代器的场景

  1. 按顺序访问集合元素: 迭代器是按需提供下一个元素的序列对象,适合在循环中按顺序访问集合元素。
  2. 遍历大型数据结构: 当处理大型数据结构时,使用迭代器可以逐个获取元素,而不需要一次性加载整个数据结构。
  3. 自定义容器类: 实现迭代器接口的类可以自定义容器,使得对象能够被 for 循环等结构遍历。
  4. 惰性计算: 迭代器也支持惰性计算,它们在需要时生成下一个元素,而不提前生成整个序列。
  5. 无需记住索引: 使用迭代器时,不需要显式地使用索引来访问元素,这使得代码更加简洁和易读。