【6.0】Python高级之迭代器

发布时间 2023-11-20 12:39:12作者: Chimengmeng

【一】迭代器介绍

  • 迭代器即用来迭代取值的工具,而迭代是重复反馈过程的活动
    • 其目的通常是为了逼近所需的目标或结果,每一次对过程的重复称为一次“迭代”
    • 而每一次迭代得到的结果会作为下一次迭代的初始值,单纯的重复并不是迭代
while True:
    msg = input('>>: ').strip()
    print(msg)
  • 下述while循环才是一个迭代过程
    • 不仅满足重复,而且以每次重新赋值后的index值作为下一次循环中新的索引进行取值
    • 反复迭代,最终可以取尽列表中的值
goods=['mac','lenovo','acer','dell','sony']

index=0
while index < len(goods):
    print(goods[index])
    index+=1

【二】可迭代对象

【1】引入

  • 通过索引的方式进行迭代取值,实现简单
    • 但仅适用于序列类型:字符串,列表,元组。对于没有索引的字典、集合等非序列类型
    • 必须找到一种不依赖索引来进行迭代取值的方式,这就用到了迭代器。
  • 要想了解迭代器为何物,必须事先搞清楚一个很重要的概念:
    • 可迭代对象(Iterable)。

【2】可迭代对象

  • 从语法形式上讲,内置有__iter__方法的对象都是可迭代对象
# 【1】数字类型
# 【1.1】整数类型 --- 不是
num = 1
print(num.__iter__)
'''
Traceback (most recent call last):
  File "E:\PythonProjects\迭代器.py", line 10, in <module>
    print(num.__iter__)
AttributeError: 'int' object has no attribute '__iter__'. Did you mean: '__str__'?
'''

# 【1.2】浮点类型 --- 不是
num_float = 1.0
print(num_float.__iter__())
'''
Traceback (most recent call last):
  File "E:\PythonProjects\迭代器.py", line 20, in <module>
    print(num_float.__iter__)
AttributeError: 'float' object has no attribute '__iter__'. Did you mean: '__str__'?
'''

# 【2】字符串类型
name = 'dream'
print(name.__iter__)
# <method-wrapper '__iter__' of str object at 0x0000021945C22430>
print(name.__iter__())
# <str_iterator object at 0x000001F6AEBCA740>

# 【3】布尔类型
is_right = False
print(is_right.__iter__)
'''
Traceback (most recent call last):
  File "E:\PythonProjects\迭代器.py", line 37, in <module>
    print(is_right.__iter__)
AttributeError: 'bool' object has no attribute '__iter__'. Did you mean: '__str__'?
'''

# 【4】列表类型
name_list = [1, 2, 3]
print(name_list.__iter__)
# <method-wrapper '__iter__' of list object at 0x0000024C3FA25300>
print(name_list.__iter__())
# <list_iterator object at 0x0000024C3FA7B9A0>

# 【5】字典类型
info_dict = {"name": "dream"}
print(info_dict.__iter__)
# <method-wrapper '__iter__' of dict object at 0x00000191955F2380>
print(info_dict.__iter__())
# <dict_keyiterator object at 0x000001919563D5D0>

# 【6】元祖类型
num_tuple = (1,)
print(num_tuple.__iter__)
# <method-wrapper '__iter__' of tuple object at 0x00000172CCD9B940>
print(num_tuple.__iter__())
# <tuple_iterator object at 0x00000172CCDDB9A0>

# 【7】集合类型
num_set = {1}
print(num_set.__iter__)
# <method-wrapper '__iter__' of set object at 0x0000027260D06CE0>
print(num_set.__iter__())
# <set_iterator object at 0x0000027260D1B880>

【3】小结

  • 非可迭代对象

    • 整数类型
    • 浮点类型
    • 布尔类型
  • 可迭代对象

    • 字符串类型
    • 列表类型
    • 字典类型
    • 元祖类型
    • 集合类型

【三】迭代器对象

  • 调用obj.__iter__()方法返回的结果就是一个迭代器对象(Iterator)。
  • 迭代器对象是内置有iternext方法的对象,打开的文件本身就是一个迭代器对象
    • 执行迭代器对象.iter()方法得到的仍然是迭代器本身
    • 而执行迭代器.next()方法就会计算出迭代器中的下一个值。
  • 迭代器是Python提供的一种统一的、不依赖于索引的迭代取值方式,只要存在多个“值”,无论序列类型还是非序列类型都可以按照迭代器的方式取值

【1】获取迭代器对象的两种方式

(1)__iter__()

name_str = 'dream'
name_iter = name_str.__iter__()
print(name_iter)
# <str_iterator object at 0x000002DF5240B9A0>

(2)iter()

name_str = 'dream'
name_iter_two = iter(name_str)
print(name_iter_two)
# <str_iterator object at 0x000002DF5240B9A0>

【2】迭代器对象取值的两种方式

(1)__next__()

name_str = 'dream'
name_iter = name_str.__iter__()
print(name_iter)
# <str_iterator object at 0x000002DF5240B9A0>
print(name_iter.__next__())
# d

(2)next()

name_str = 'dream'
name_iter = name_str.__iter__()
print(name_iter)
# <str_iterator object at 0x000002DF5240B9A0>
print(name_iter.__next__())
# d
print(next(name_iter))
# r

【3】数据类型示例

# 【1】字符串类型
name_str = 'dream'
name_iter = name_str.__iter__()
name_iter_two = iter(name_str)
print(name_iter)
print(name_iter_two)
# <str_iterator object at 0x000002DF5240B9A0>
# <str_iterator object at 0x000002DF5240B9A0>
print(name_iter.__next__())
# d
print(next(name_iter))
# r

# 【2】列表类型
name_list = [1, 2, 3]
name_list_iter = iter(name_list)
print(name_list_iter)
# <list_iterator object at 0x0000021C9E813F10>
print(name_list_iter.__next__())
# 1
print(next(name_list_iter))
# 2

# 【3】字典类型
info_dict = {"name": "dream", "age": 18}
info_dict_iter = iter(info_dict)
print(info_dict_iter)
# <dict_keyiterator object at 0x000002577ADDD440>
print(info_dict_iter.__next__())
# name
print(next(info_dict_iter))
# age

# 【4】元祖类型
num_tuple = (1, 2)
num_tuple_iter = iter(num_tuple)
print(num_tuple_iter)
# <tuple_iterator object at 0x00000222615D3EE0>
print(num_tuple_iter.__next__())
# 1
print(next(num_tuple_iter))
# 2

# 【5】集合类型
num_set = {1, 2, 3}
num_set_iter = iter(num_set)
print(num_set_iter)
# <set_iterator object at 0x000002CCB2B50EC0>
print(num_set_iter.__next__())
# 1
print(next(num_set_iter))
# 2

【四】for循环原理详解

  • 有了迭代器后,我们便可以不依赖索引迭代取值了,使用while循环的实现方式如下
goods=['mac','lenovo','acer','dell','sony']
i=iter(goods) #每次都需要重新获取一个迭代器对象
while True:
    try:
        print(next(i))
    except StopIteration: #捕捉异常终止循环
        break
  • for循环又称为迭代循环,in后可以跟任意可迭代对象,上述while循环可以简写为
goods=['mac','lenovo','acer','dell','sony']
for item in goods:   
    print(item)
  • for 循环在工作时
    • 首先会调用可迭代对象goods内置的iter方法拿到一个迭代器对象
    • 然后再调用该迭代器对象的next方法将取到的值赋给item
    • 执行循环体完成一次循环
    • 周而复始,直到捕捉StopIteration异常,结束迭代。

【五】迭代器的优缺点

  • 基于索引的迭代取值,所有迭代的状态都保存在了索引中
  • 而基于迭代器实现迭代的方式不再需要索引
  • 所有迭代的状态就保存在迭代器中
  • 然而这种处理方式优点与缺点并存

【1】优点

  • 为序列和非序列类型提供了一种统一的迭代取值方式。
  • 惰性计算:
    • 迭代器对象表示的是一个数据流,可以只在需要时才去调用next来计算出一个值
    • 就迭代器本身来说,同一时刻在内存中只有一个值,因而可以存放无限大的数据流,而对于其他容器类型
    • 如列表,需要把所有的元素都存放于内存中,受内存大小的限制,可以存放的值的个数是有限的。

【2】缺点

  • 除非取尽,否则无法获取迭代器的长度
  • 只能取下一个值,不能回到开始,更像是‘一次性的’,迭代器产生后的唯一目标就是重复执行next方法直到值取尽,否则就会停留在某个位置,等待下一次调用next;
  • 若是要再次迭代同个对象,你只能重新调用iter方法去创建一个新的迭代器对象,如果有两个或者多个循环使用同一个迭代器,必然只会有一个循环能取到值。