开发相关知识

python中的生成器

2019-06-17  本文已影响1人  暖A暖

什么是生成器

在学习生成器之前,首先我们要知道什么是生成器? 在python中一边循环一边计算的机制就是生成器(generator)

生成器作用

知道了什么是生成器之后,我们需要知道为什么要有生成器呢? 也就是说这种一边循环一边计算的机制有什么用处呢?

我们知道列表中所有的数据都存在内存中,如果数据很多的话将会特别消耗内存。先不说内存有没有这么大,假设我们仅仅需要访问前面几个元素,那后面元素所占用的空间岂不是都白费了吗。

所以这个时候如果列表中的元素能够按照某种算法自动推算出来呢,是不是就不必创建完整的列表,可以节省大量的内存空间了。所以如果又想节省内存,又需要用到很多数据就可以使用生成器。

创建生成器

通过类似列表生成式方式实现

创建生成器有好几种方法,最简单一种就是把一个列表生成式的[]改成(),这样就能直接创建一个生成器:

# 列表生成式
list = [x for x in range(10)]
print(list)  # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

# 生成器
generator = (x for x in range(10))
print(generator)  # <generator object <genexpr> at 0x0000000002131A20>

我们可以直接通过print(list),将list中所有元素打印出来。但是print(generator)打印出来的却是一个对象,如果我们想要打印出生成器中的元素要怎么帮?有两种方式:

generator = (x for x in range(10))

print(next(generator))  # 0
print(next(generator))  # 1
print(next(generator))  # 2

每次调用一次next()方法就计算出下一个元素的值,直到超出最后一个元素时,则会抛出StopIteration错误。
这种方法只能一个一个元素打印,如果只需要前面几个元素,用这样方法刚好。如果需要打印很多元素,这个方法就太不方便了。这时候我们可以用第二种方法。

generator = (x for x in range(5))
for g in generator:
    print(g)

# 输出:
0
1
2
3
4

这样不仅可以一次性将所有元素打印出来,且通过for循环打印不需要担心会发生StopIteration异常。

这样看起来和列表生成式没差?但我们要注意列表生成式是直接将所有元素存在了内存空间中,这样占用了大量内存。而生成器并不是立即将结果写入内存, 而是保存的一种计算方式, 通过不断的计算, 可以获取到相应的位置的值,所以占用的内存仅仅是对计算对象的保存。

方法二:通过函数来实现

如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。只需要在函数中定义一个yield语句就行。
所以带有 yield 的函数不再是一个普通函数,而是一个生成器。yield相当于 return 返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield的下一条语句开始执行。

def gen_yield():
    for i in range(3):
        yield i

g = gen_yield()
print(next(g))  # 0
print(next(g))  # 1
print(next(g))  # 2
print(next(g))  # 报错:StopIteration

# 生成器函数每一次next()迭代,会返回当前yield的值,且在此处暂停,下一次next()迭代,
# 从上一次的yield处开始,向下执行,且依然在下一次的yield中暂停

# for循环迭代
for i in g:
    print(i)

# 输出:
0
1
2

上述中gen_yield()其实就是一个生成器函数,如果我们想要得到这个函数中的返回值,同样可以通过next()方法或者for循环迭代来得到。

上一篇下一篇

猜你喜欢

热点阅读