详解 python 中的迭代操作和迭代器、生成器

本贴最后更新于 1152 天前,其中的信息可能已经水流花落

迭代器和生成器是python面试的时候,被问概率较高的一个知识点,很多小伙伴都不太分得清这两者的区别,今天就来给大家详细的讲解迭代器和生成器的区别。

一、可迭代对象

再讲解迭代器和生成器之前,我们得先说说可迭代对象,所谓的可迭代对象就是能够通过for循环迭代,逐一返回其成员项的对象称为可迭代对象, python中可迭代对象包括

二、for循环迭代到底干了啥?

1、 __iter__() 方法

__iter__() 在python中也被称作迭代协议,只要对象拥有 __iter__() 方法,那么该对象就实现了迭代协议,就可以进行迭代操作。

另外 __iter__() 方法的返回值,必须是一个迭代器(迭代器下章详细讲解)。

python中的list、str、tuple、dict、set等类型都实现了 __iter__() (迭代协议),所以能够直接进行遍历。

当我们用for去遍历任何一个对象时,for循环执行的时候,会先去调用对象的 __iter__(),根据__iter__()返回的迭代器,再进行迭代操作。

下面是我自己定义的一个实现__iter__()方法,可迭代对象的类

class MyArray:
    """自定义的可迭代对象类"""
    def __iter__(self):
        return iter([11, 22, 33, 44])
  
if __name__ == '__main__':
    m = MyArray()
    for i in m:
        print(i)

执行结果:

11
22
33
44

上面案例遍历自定义MyArray类的对象,可以看到遍历出来的是 __iter__()返回迭代器中的数据

2、__getitem__()方法

__getitem__()是用来实现序列类型数据索引取值的魔术方法。python中的str、list、dict等类型的数据均实现了该方法。

li = [11,22,33]
dic = {'a':11,'b':22}
# 列表索引取值,本质上调用的是 li.__getitem__(1)方法去取值的。
li[1]

前面说到for循环遍历对象的时候,会先去调用对象的 __iter__() 方法,如果对象没有定义 __iter__() 方法,那么for在遍历的时候,就会从索引 0 开始,循环调用__getitem__(),,把__getitem__()的返回值,作为遍历出来的数据,直到__getitem__()中抛出异常,则终止循环。

下面是通过__getitem__()方法实现的可迭代对象的类。

class Mylist2:
    """自定义的序列类类"""
    li = ['a1', 'a2', 'a3', 'a4']
    def __getitem__(self, item):
        # iten是for循环内部传进来的索引值,从0开始
        return self.li[item]
  
if __name__ == '__main__':
    m2 = Mylist2()
    for i in m2:
        print(i)

执行结果:

a1
a2
a3
a4

从上面的案例中我们可以看到我们在遍历Mylist2这个类的对象时,其实就是不断的调用对象的__getitem__方法来获取遍历出来的值。

二、迭代器(Iterator)

理解了什么是可迭代对象和for循环迭代的机制之后,我们再来了解一下迭代器协议和迭代器。

3.1、迭代器协议:

迭代器协议由一个`__iter__` 方法和__next__方法共同构成。实现了这两个方法的对象就实现了迭代器协议。

3.2、迭代器

三、生成器

问题:什么是生成器?生成器有什么作用?

是一种特殊的迭代器,具备迭代器所有的特性,生成器内部不存储数据,只保存生成数据的计算规则,在存储大量数据的时候,能够节约内存的开销

python中定义生成器,一共有两种方式,一种是生成器表达式,另一种是生成器函数。

4.1、生成器表达式

生成器表达式的语法其实就是把列表推导式的中括号改成小括号,如下:

gen_ =(item for item in range(10))
print(gen_)

运行结果:

<generator object <genexpr> at 0x00000000023A8DB0>

上面运行的结果是一个generator object,就是一个生成器对象,而上面写的表达式,就叫做生成器表达式

4.2、生成器函数

在函数中使用yeild关键字可以定义一个生成器函数。只要当函数中有yeild这个关键字,那么就不能再把它看成一个简单的函数,调用函数不会直接执行函数内部的代码,而是直接返回的就是一个生成器对象

def func():
    for i in item:
        yeild i

#调用函数   
gen_lsit = func()
print(type(gen_list))
#返回的是一个generator对象

#同样也可以使用next生成数据
next(gen_list)

四、生成器和迭代器的区别:

生成器属于迭代器的一种,如何区分迭代器和生成器?

def gen():
    for i in range(10):
        yield i

g = gen()
print(next(g))

print(g.send(10))

# close:关闭生成器
# g.close()

# throw :在生成器内部主动引发一个异常   参数:异常类型  异常信息
# g.throw(ValueError, "hello python")

1 操作
mslemonban 在 2021-10-30 13:46:30 更新了该帖
回帖
请输入回帖内容 ...