第十四章、迭代器和解析,第一部分
迭代器:初探
实际上,对Python中所有会从左至右扫描对象的迭代工具而言都是如此,这些迭代工具包括了for循环、列表解析、in成员关系测试以及map内置函数等。
“可迭代对象”的概念在Python中是相当新颖的,但它在语言的设计中很普遍。基本上,这就是序列观念的通用化:如果对手是实际保存的序列,或者可以在迭代工具环境中(例如,for循环)一次产生一个结果的对象,就看做是可迭代的。总之,可迭代对象包括实际序列和按照需求而计算的虚拟序列。
1、文件迭代器:
已经打开的文件对象有个方法名为readline,可以一次从文件中读取一行文本,每次调用readline方法时,就会前进到下一行。到达末尾时,就会返回空字符串,我们可通过它来检测,从而跳出循环。
如今,文件也有一个方法,名为__next__,差不多有相同的效果:每次调用时,就会返回文件中的下一行。唯一值得注意的区别在于,到达文件末尾时,__next__会引发内置的StopIteration异常,而不是空字符串。
这个接口就是Python中所谓的迭代协议:有__next__方法的对象会前进到下一个结果而在一系列结果的末尾时,则会引发StopIteration。在Python中,任何这类对象都认为是可迭代的。
2、手动迭代:iter和next:
为了支持手动迭代代码(用较少的录入),Python3.0还提供了一个内置函数next,它会自动调用一个对象的__next__方法。给定一个可迭代对象X,调用next(X)等同于X.__next__(),但前者简单很多。
从技术角度来讲,迭代协议还有一点值得注意。当for循环开始时,会通过它传给iter内置函数,以便从可迭代对象中获取一个迭代器,返回的对象含有需要的next方法。
3、其他内置类型的迭代器:
除了文件以及像列表这样的实际的序列外,其他类型也有其适用的迭代器。
列表解析:初探
与for循环一起使用,列表解析是最常应用迭代协议的环境之一。
1、列表解析基础知识:
列表解析从语法上讲,其语法源自于集合理论表示法中的一个结构,该结构对集合中的每个元素应用一个操作,但是,要使用这个工具并不一定必须知道集合理论。
列表解析写在一个方括号中,因为它们最终是构建一个新的列表的一种方式。它们以我们所组成的一个任意的表达式开始,该表达式使用我们所组成的一个循环变量。这后边跟着我们现在应该看做是一个for循环头部的部分,它声明了循环变量,以及一个可迭代对象。
2、在文件上使用列表解析:
当我们开始考虑在一个序列中的每项上执行一个操作时,都可以考虑使用列表解析。
由于列表解析像for循环语句一样是一个迭代环境,我们甚至不必提前打开文件。
我们可以在迭代时在一个文件的行上运行任何的字符串操作。
3、扩展的列表解析语法:
作为一个特别有用的扩展,表达式中嵌套的for循环可以有一个相关的if语句,来过滤哪些测试不为真的结果项。
其他迭代环境
实现了迭代协议的任何工具,都能够在提供了该工具的任何内置类型或用户定义的类上自动地工作。
map调用,它是一个内置函数,它把一个函数调用应用于传入的可迭代对象中的每一项。
Python还包含了各种处理迭代的其他内置函数:sorted排序可迭代对象中的项,zip组合可迭代对象中的各项,enumerate根据相对位置来配对可迭代对象中的项,filter选择一个函数为真的项,reduce针对可迭代对象中的成对的项运行一个函数。
Python3.0中的新的可迭代对象
Python3.0中的一个基本的改变是,它比Python2.X更强调迭代。
1、range迭代器:
在Python3.0中,它返回一个迭代器,该迭代器根据需要产生范围中的数字,而不是在内存中构建一个结果列表。这取代了较早的Python2.X xrange,如果需要一个范围列表的话,你必须使用list(range(...))来强制一个真正的范围列表(例如,显示结果)。
2、map、zip和filter迭代器:
和range类似,map、zip以及filter内置函数在Python3.0中也转变成迭代器以节约内存空间,而不再在内存中一次性生成一个结果列表。所有这3个函数不仅像是在Python2.X一样处理可迭代对象,而且在Python3.0中返回可迭代结果。和range不同,它们都是自己的迭代器——在遍历其结果一次之后,它们就用尽了。
3、多个可迭代器VS单个迭代器:
range对象支持len和索引,它不是自己的迭代器(手动迭代时,我们使用iter产生一个迭代器),并且,它支持在其结果上的多个迭代器,这些迭代器会记住它们各自的位置。相反,zip、map和filter不支持相同结果上的多个活跃迭代器。
4、字典视图迭代器:
在Python3.0中,字典的keys、values和items方法返回可迭代的视图对象,它们一次产生一个结果项,而不是在内存中一次产生全部结果列表。
Python3.0字典仍然有自己的迭代器,它返回连续的键。
其他迭代其主题
①、使用yield语句,用户定义的函数可以转换为可迭代的生成器函数。
②、当编写在圆括号中的时候,列表解析转变为可迭代的生成器表达式。
③、用户定义的类通过__iter__或__getitem__运算符重载变得可迭代。
本章小结
在本章中,我们介绍了Python中与循环相关的概念。我们对Python的迭代协议做了第一次的实质性的讨论:这是非序列对象参与迭代循环以及列表解析的方式。就像我们所见到的一样,列表解析类似于for循环,会将表达式施加到任何可迭代的对象中的所有元素。此外,我们还看到了其他内置迭代工具的使用,并且学习了Python3.0中关于迭代的最新变化。