模块和包
模块
Python会将所有 .py
结尾的文件认定为Python代码文件,考虑下面的脚本 ex1.py
:
In [1]:
- %%writefile ex1.py
- PI = 3.1416
- def sum(lst):
- tot = lst[0]
- for value in lst[1:]:
- tot = tot + value
- return tot
- w = [0, 1, 2, 3]
- print sum(w), PI
- Overwriting ex1.py
可以执行它:
In [2]:
- %run ex1.py
- 6 3.1416
这个脚本可以当作一个模块,可以使用import
关键词加载并执行它(这里要求ex1.py
在当前工作目录):
In [3]:
- import ex1
- 6 3.1416
In [4]:
- ex1
Out[4]:
- <module 'ex1' from 'ex1.py'>
在导入时,Python会执行一遍模块中的所有内容。
ex1.py
中所有的变量都被载入了当前环境中,不过要使用
ex1.变量名
的方法来查看或者修改这些变量:
In [5]:
- print ex1.PI
- 3.1416
In [6]:
- ex1.PI = 3.141592653
- print ex1.PI
- 3.141592653
还可以用
ex1.函数名
调用模块里面的函数:
In [7]:
- print ex1.sum([2, 3, 4])
- 9
为了提高效率,Python只会载入模块一次,已经载入的模块再次载入时,Python并不会真正执行载入操作,哪怕模块的内容已经改变。
例如,这里重新导入 ex1
时,并不会执行 ex1.py
中的 print
语句:
In [8]:
- import ex1
需要重新导入模块时,可以使用reload
强制重新载入它,例如:
In [9]:
- reload(ex1)
- 6 3.1416
Out[9]:
- <module 'ex1' from 'ex1.pyc'>
删除之前生成的文件:
In [10]:
- import os
- os.remove('ex1.py')
name 属性
有时候我们想将一个 .py
文件既当作脚本,又能当作模块用,这个时候可以使用 name
这个属性。
只有当文件被当作脚本执行的时候, name
的值才会是 'main'
,所以我们可以:
In [11]:
- %%writefile ex2.py
- PI = 3.1416
- def sum(lst):
- """ Sum the values in a list
- """
- tot = 0
- for value in lst:
- tot = tot + value
- return tot
- def add(x, y):
- " Add two values."
- a = x + y
- return a
- def test():
- w = [0,1,2,3]
- assert(sum(w) == 6)
- print 'test passed.'
- if __name__ == '__main__':
- test()
- Writing ex2.py
运行文件:
In [12]:
- %run ex2.py
- test passed.
当作模块导入, test()
不会执行:
In [13]:
- import ex2
但是可以使用其中的变量:
In [14]:
- ex2.PI
Out[14]:
- 3.1416
使用别名:
In [15]:
- import ex2 as e2
- e2.PI
Out[15]:
- 3.1416
其他导入方法
可以从模块中导入变量:
In [16]:
- from ex2 import add, PI
使用 from
后,可以直接使用 add
, PI
:
In [17]:
- add(2, 3)
Out[17]:
- 5
或者使用 *
导入所有变量:
In [18]:
- from ex2 import *
- add(3, 4.5)
Out[18]:
- 7.5
这种导入方法不是很提倡,因为如果你不确定导入的都有哪些,可能覆盖一些已有的函数。
删除文件:
In [19]:
- import os
- os.remove('ex2.py')
包
假设我们有这样的一个文件夹:
foo/
init.py
bar.py
(defines func)baz.py
(defines zap) 这意味着 foo 是一个包,我们可以这样导入其中的内容:
- from foo.bar import func
- from foo.baz import zap
bar
和 baz
都是 foo
文件夹下的 .py
文件。
导入包要求:
- 文件夹
foo
在Python的搜索路径中 init.py
表示foo
是一个包,它可以是个空文件。
常用的标准库
- re 正则表达式
- copy 复制
- math, cmath 数学
- decimal, fraction
- sqlite3 数据库
- os, os.path 文件系统
- gzip, bz2, zipfile, tarfile 压缩文件
- csv, netrc 各种文件格式
- xml
- htmllib
- ftplib, socket
- cmd 命令行
- pdb
- profile, cProfile, timeit
- collections, heapq, bisect 数据结构
- mmap
- threading, Queue 并行
- multiprocessing
- subprocess
- pickle, cPickle
- struct
PYTHONPATH设置
Python的搜索路径可以通过环境变量PYTHONPATH设置,环境变量的设置方法依操作系统的不同而不同,具体方法可以网上搜索。