模块和包

模块

Python会将所有 .py 结尾的文件认定为Python代码文件,考虑下面的脚本 ex1.py

In [1]:

  1. %%writefile ex1.py
  2.  
  3. PI = 3.1416
  4.  
  5. def sum(lst):
  6. tot = lst[0]
  7. for value in lst[1:]:
  8. tot = tot + value
  9. return tot
  10.  
  11. w = [0, 1, 2, 3]
  12. print sum(w), PI
  1. Overwriting ex1.py

可以执行它:

In [2]:

  1. %run ex1.py
  1. 6 3.1416

这个脚本可以当作一个模块,可以使用import关键词加载并执行它(这里要求ex1.py在当前工作目录):

In [3]:

  1. import ex1
  1. 6 3.1416

In [4]:

  1. ex1

Out[4]:

  1. <module 'ex1' from 'ex1.py'>

在导入时,Python会执行一遍模块中的所有内容。

ex1.py 中所有的变量都被载入了当前环境中,不过要使用

  1. ex1.变量名

的方法来查看或者修改这些变量:

In [5]:

  1. print ex1.PI
  1. 3.1416

In [6]:

  1. ex1.PI = 3.141592653
  2. print ex1.PI
  1. 3.141592653

还可以用

  1. ex1.函数名

调用模块里面的函数:

In [7]:

  1. print ex1.sum([2, 3, 4])
  1. 9

为了提高效率,Python只会载入模块一次,已经载入的模块再次载入时,Python并不会真正执行载入操作,哪怕模块的内容已经改变。

例如,这里重新导入 ex1 时,并不会执行 ex1.py 中的 print 语句:

In [8]:

  1. import ex1

需要重新导入模块时,可以使用reload强制重新载入它,例如:

In [9]:

  1. reload(ex1)
  1. 6 3.1416

Out[9]:

  1. <module 'ex1' from 'ex1.pyc'>

删除之前生成的文件:

In [10]:

  1. import os
  2. os.remove('ex1.py')

name 属性

有时候我们想将一个 .py 文件既当作脚本,又能当作模块用,这个时候可以使用 name 这个属性。

只有当文件被当作脚本执行的时候, name的值才会是 'main',所以我们可以:

In [11]:

  1. %%writefile ex2.py
  2.  
  3. PI = 3.1416
  4.  
  5. def sum(lst):
  6. """ Sum the values in a list
  7. """
  8. tot = 0
  9. for value in lst:
  10. tot = tot + value
  11. return tot
  12.  
  13. def add(x, y):
  14. " Add two values."
  15. a = x + y
  16. return a
  17.  
  18. def test():
  19. w = [0,1,2,3]
  20. assert(sum(w) == 6)
  21. print 'test passed.'
  22.  
  23. if __name__ == '__main__':
  24. test()
  1. Writing ex2.py

运行文件:

In [12]:

  1. %run ex2.py
  1. test passed.

当作模块导入, test() 不会执行:

In [13]:

  1. import ex2

但是可以使用其中的变量:

In [14]:

  1. ex2.PI

Out[14]:

  1. 3.1416

使用别名:

In [15]:

  1. import ex2 as e2
  2. e2.PI

Out[15]:

  1. 3.1416

其他导入方法

可以从模块中导入变量:

In [16]:

  1. from ex2 import add, PI

使用 from 后,可以直接使用 addPI

In [17]:

  1. add(2, 3)

Out[17]:

  1. 5

或者使用 * 导入所有变量:

In [18]:

  1. from ex2 import *
  2. add(3, 4.5)

Out[18]:

  1. 7.5

这种导入方法不是很提倡,因为如果你不确定导入的都有哪些,可能覆盖一些已有的函数。

删除文件:

In [19]:

  1. import os
  2. os.remove('ex2.py')

假设我们有这样的一个文件夹:

foo/

  • init.py
  • bar.py (defines func)
  • baz.py (defines zap) 这意味着 foo 是一个包,我们可以这样导入其中的内容:
  1. from foo.bar import func
  2. from foo.baz import zap

barbaz 都是 foo 文件夹下的 .py 文件。

导入包要求:

  • 文件夹 fooPython的搜索路径中
  • init.py 表示 foo 是一个包,它可以是个空文件。

常用的标准库

  • re 正则表达式
  • copy 复制
  • math, cmath 数学
  • decimal, fraction
  • sqlite3 数据库
  • os, os.path 文件系统
  • gzip, bz2, zipfile, tarfile 压缩文件
  • csv, netrc 各种文件格式
  • xml
  • htmllib
  • ftplib, socket
  • cmd 命令行
  • pdb
  • profile, cProfile, timeit
  • collections, heapq, bisect 数据结构
  • mmap
  • threading, Queue 并行
  • multiprocessing
  • subprocess
  • pickle, cPickle
  • struct

PYTHONPATH设置

Python的搜索路径可以通过环境变量PYTHONPATH设置,环境变量的设置方法依操作系统的不同而不同,具体方法可以网上搜索。

原文: https://nbviewer.jupyter.org/github/lijin-THU/notes-python/blob/master/02-python-essentials/02.18-modules-and-packages.ipynb