Python点滴Pythoner集中营程序员

Pyhton迭代器

2015-07-25  本文已影响1137人  TypingQuietly

毋庸置疑,迭代器有很多好处:

for text_line in open("xx.txt"):
    print text_line

或者对xml文件进行处理的时候:

tree = etree.iterparse(xml, ['start', 'end'])
for event, elem in tree:
    if event == "end"
        result = etree.tostring(elem)
        elem.clear()
        print result

内置函数open返回的file对象和etree.iterparse序列化的xml tree都是可迭代对象,能够让我们渐进式地对文件的内容进行处理。

for i in [1, 2, 3, 4]
    print i,

简单了解了一下迭代器的好处后,我们正正紧紧的聊聊python的迭代器模式
在这里我们引入两个比较绕口的名词:可迭代对象迭代器对象,个人觉得从这两个概念下手会对迭代器有比较好的理解。在放例子前先对这两个概念给一个不入流的解释:

放个例子边看边说:

class iterable_range:
    def __init__(self, n):
        self.n = n

    def __iter__(self):
        return my_range_iterator(self.n)

class my_range_iterator:
    def __init__(self, n):
        self.i = 0
        self.n = n

    def next(self):
        if self.i < self.n:
            i = self.i
            self.i += 1
            print 'iterator get number:', i
            return i
        else:
            raise StopIteration()
    ```
例子中的`iterable_range`是一个可迭代对象,所以我们也能够对它用for语句来进行迭代:

temp = my_range(10)
for item in temp:
print item,

output:
my iterator get number: 0
0
my iterator get number: 1
1
my iterator get number: 2
2
my iterator get number: 3
3
my iterator get number: 4
4
my iterator get number: 5
5
my iterator get number: 6
6
my iterator get number: 7
7
my iterator get number: 8
8
my iterator get number: 9
9

大家可以仔细地看一下输出的日志:
1.  数据确实是“流式”处理的
2.  iterator是真正在背后做事的人
3. `for`语句能够非常方便的迭代对象的数据。

可迭代对象其实更像是整个`迭代器模式`模式的上层,像一种约束一种契约一种规范,它能够保证自己能够返回一个在实际工作中干活的迭代器对象。`for`、`sum`等接受一个可迭代对象的方法都是遵循这样的规范:调用对象的`__iter__`函数,返回迭代器,对迭代器对象返回的每个值进行处理抑或需要一些汇总的操作。拿`for`举个例子:

iterator_object = iterable_object.iter()
while True:
try:
value = iterator_object.next()
except StopIteration:
# StopIteration exception is raised after last element
break

# loop code
print value

**`for`**这个语法糖背后的逻辑差不多就是上面例子中代码所示的那样:首先获取可迭代对象返回的迭代器对象,然后调用迭代器对象的`next`方法获取每个值,在获取值的过程中随时检测边界-也就是检查是否抛出了`StopIteration`这样的错误,如果迭代器对象抛出错误则迭代停止(note:从这个例子可以看出,对于那些接受可迭代对象的方法,如果我们传一个单纯的迭代器对象其实也是无法工作的,可能会报出类似于`TypeError: iteration over non-sequence`的错误)。
当然了,一般在应用过程中我们不会将他们特意的分开,我们能够稍微对迭代器对象进行修改一下,添加`__iter__`方法的实现,这样对象本身就既是可迭代对象也是一个迭代器对象了:

class my_range_iterator:
def init(self, n):
self.i = 0
self.n = n

  def __iter__(self):
    return self

  def next(self):
    if self.i < self.n:
        i = self.i

        self.i += 1
        print 'my iterator get number:', i
        return i
    else:
        raise StopIteration()

for item in my_range_iterator(10):
print item

output:
my iterator get number: 0
0
my iterator get number: 1
1
my iterator get number: 2
2
my iterator get number: 3
3
my iterator get number: 4
4
my iterator get number: 5
5
my iterator get number: 6
6
my iterator get number: 7
7
my iterator get number: 8
8
my iterator get number: 9
9

上一篇下一篇

猜你喜欢

热点阅读