filter

Python内建的filter()函数用于过滤序列。

map()类似,filter()也接收一个函数和一个序列。和map()不同的时,filter()把传入的函数依次作用于每个元素,然后根据返回值是True还是False决定保留还是丢弃该元素。

例如,在一个list中,删掉偶数,只保留奇数,可以这么写:

  1. def is_odd(n):
  2. return n % 2 == 1
  3. list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
  4. # 结果: [1, 5, 9, 15]

把一个序列中的空字符串删掉,可以这么写:

  1. def not_empty(s):
  2. return s and s.strip()
  3. list(filter(not_empty, ['A', '', 'B', None, 'C', ' ']))
  4. # 结果: ['A', 'B', 'C']

可见用filter()这个高阶函数,关键在于正确实现一个“筛选”函数。

注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list。

用filter求素数

计算素数的一个方法是埃氏筛法,它的算法理解起来非常简单:

首先,列出从2开始的所有自然数,构造一个序列:

2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, …

取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉:

3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, …

取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉:

5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, …

取新序列的第一个数5,然后用5把序列的5的倍数筛掉:

7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, …

不断筛下去,就可以得到所有的素数。

用Python来实现这个算法,可以先构造一个从3开始的奇数序列:

  1. def _odd_iter():
  2. n = 1
  3. while True:
  4. n = n + 2
  5. yield n

注意这是一个生成器,并且是一个无限序列。

然后定义一个筛选函数:

  1. def _not_divisible(n):
  2. return lambda x: x % n > 0

最后,定义一个生成器,不断返回下一个素数:

  1. def primes():
  2. yield 2
  3. it = _odd_iter() # 初始序列
  4. while True:
  5. n = next(it) # 返回序列的第一个数
  6. yield n
  7. it = filter(_not_divisible(n), it) # 构造新序列

这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。

由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:

  1. # 打印1000以内的素数:
  2. for n in primes():
  3. if n < 1000:
  4. print(n)
  5. else:
  6. break

注意到Iterator是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。

练习

回数是指从左向右读和从右向左读都是一样的数,例如12321909。请利用filter()滤掉非回数:

  1. # -*- coding: utf-8 -*-
  2. def is_palindrome(n):
  3. pass
  4. # 测试:
  5. output = filter(is_palindrome, range(1, 1000))
  6. print(list(output))

小结

filter()的作用是从一个序列中筛出符合条件的元素。由于filter()使用了惰性计算,所以只有在取filter()结果的时候,才会真正筛选并每次返回下一个筛出的元素。

参考源码

do_filter.py

prime_numbers.py

原文: https://wizardforcel.gitbooks.io/liaoxuefeng/content/py3/31.html