4.16 迭代器代替while无限循环

问题

你在代码中使用 while 循环来迭代处理数据,因为它需要调用某个函数或者和一般迭代模式不同的测试条件。能不能用迭代器来重写这个循环呢?

解决方案

一个常见的IO操作程序可能会想下面这样:

  1. CHUNKSIZE = 8192
  2.  
  3. def reader(s):
  4. while True:
  5. data = s.recv(CHUNKSIZE)
  6. if data == b'':
  7. break
  8. process_data(data)

这种代码通常可以使用 iter() 来代替,如下所示:

  1. def reader2(s):
  2. for chunk in iter(lambda: s.recv(CHUNKSIZE), b''):
  3. pass
  4. # process_data(data)

如果你怀疑它到底能不能正常工作,可以试验下一个简单的例子。比如:

  1. >>> import sys
  2. >>> f = open('/etc/passwd')
  3. >>> for chunk in iter(lambda: f.read(10), ''):
  4. ... n = sys.stdout.write(chunk)
  5. ...
  6. nobody:*:-2:-2:Unprivileged User:/var/empty:/usr/bin/false
  7. root:*:0:0:System Administrator:/var/root:/bin/sh
  8. daemon:*:1:1:System Services:/var/root:/usr/bin/false
  9. _uucp:*:4:4:Unix to Unix Copy Protocol:/var/spool/uucp:/usr/sbin/uucico
  10. ...
  11. >>>

讨论

iter 函数一个鲜为人知的特性是它接受一个可选的 callable 对象和一个标记(结尾)值作为输入参数。当以这种方式使用的时候,它会创建一个迭代器, 这个迭代器会不断调用 callable 对象直到返回值和标记值相等为止。

这种特殊的方法对于一些特定的会被重复调用的函数很有效果,比如涉及到I/O调用的函数。举例来讲,如果你想从套接字或文件中以数据块的方式读取数据,通常你得要不断重复的执行 read()recv() ,并在后面紧跟一个文件结尾测试来决定是否终止。这节中的方案使用一个简单的 iter() 调用就可以将两者结合起来了。其中 lambda 函数参数是为了创建一个无参的 callable 对象,并为 recvread() 方法提供了 size 参数。

原文:

http://python3-cookbook.readthedocs.io/zh_CN/latest/c04/p16_replace_infinite_while_loops_with_iterator.html