python中的生成器
什么是生成器
在学习生成器之前,首先我们要知道什么是生成器? 在python中一边循环一边计算的机制就是生成器(generator)。
生成器作用
知道了什么是生成器之后,我们需要知道为什么要有生成器呢? 也就是说这种一边循环一边计算的机制有什么用处呢?
我们知道列表中所有的数据都存在内存中,如果数据很多的话将会特别消耗内存。先不说内存有没有这么大,假设我们仅仅需要访问前面几个元素,那后面元素所占用的空间岂不是都白费了吗。
所以这个时候如果列表中的元素能够按照某种算法自动推算出来呢,是不是就不必创建完整的列表,可以节省大量的内存空间了。所以如果又想节省内存,又需要用到很多数据就可以使用生成器。
创建生成器
通过类似列表生成式方式实现
创建生成器有好几种方法,最简单一种就是把一个列表生成式的[]
改成()
,这样就能直接创建一个生成器:
# 列表生成式
list = [x for x in range(10)]
print(list) # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
# 生成器
generator = (x for x in range(10))
print(generator) # <generator object <genexpr> at 0x0000000002131A20>
我们可以直接通过print(list),将list中所有元素打印出来。但是print(generator)打印出来的却是一个对象,如果我们想要打印出生成器中的元素要怎么帮?有两种方式:
- 一:通过next()方法一个一个元素打印:
generator = (x for x in range(10))
print(next(generator)) # 0
print(next(generator)) # 1
print(next(generator)) # 2
每次调用一次next()方法
就计算出下一个元素的值,直到超出最后一个元素时,则会抛出StopIteration错误。
这种方法只能一个一个元素打印,如果只需要前面几个元素,用这样方法刚好。如果需要打印很多元素,这个方法就太不方便了。这时候我们可以用第二种方法。
- 二:使用for循环,因为生成器也是可迭代对象。
generator = (x for x in range(5))
for g in generator:
print(g)
# 输出:
0
1
2
3
4
这样不仅可以一次性将所有元素打印出来,且通过for循环打印不需要担心会发生StopIteration异常。
这样看起来和列表生成式没差?但我们要注意列表生成式是直接将所有元素存在了内存空间中,这样占用了大量内存。而生成器并不是立即将结果写入内存, 而是保存的一种计算方式, 通过不断的计算, 可以获取到相应的位置的值,所以占用的内存仅仅是对计算对象的保存。
方法二:通过函数来实现
如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。只需要在函数中定义一个yield语句就行。
所以带有 yield 的函数不再是一个普通函数,而是一个生成器。yield相当于 return 返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield的下一条语句开始执行。
def gen_yield():
for i in range(3):
yield i
g = gen_yield()
print(next(g)) # 0
print(next(g)) # 1
print(next(g)) # 2
print(next(g)) # 报错:StopIteration
# 生成器函数每一次next()迭代,会返回当前yield的值,且在此处暂停,下一次next()迭代,
# 从上一次的yield处开始,向下执行,且依然在下一次的yield中暂停
# for循环迭代
for i in g:
print(i)
# 输出:
0
1
2
上述中gen_yield()
其实就是一个生成器函数,如果我们想要得到这个函数中的返回值,同样可以通过next()方法或者for循环迭代来得到。