copy —- 浅层及深层拷贝操作

源代码: Lib/copy.py


Python 的赋值语句不复制对象,而是创建目标和对象的绑定关系。对于自身可变,或包含可变项的集合,有时要生成副本用于改变操作,而不必改变原始对象。本模块提供了通用的浅层复制和深层复制操作,(如下所述)。

接口摘要:

copy.copy(obj)

返回 obj 的浅拷贝。

copy.deepcopy(obj[, memo])

返回 obj 的深拷贝。

copy.replace(obj, /, **changes)

新建一个与 obj 类型相同的对象,使用来自 changes 的值替换字段。

Added in version 3.13.

exception copy.Error

针对模块特定错误引发。

浅层与深层复制的区别仅与复合对象(即包含列表或类的实例等其他对象的对象)相关:

  • 浅层复制 构造一个新的复合对象,然后(在尽可能的范围内)将原始对象中找到的对象的 引用 插入其中。

  • 深层复制 构造一个新的复合对象,然后,递归地将在原始对象里找到的对象的 副本 插入其中。

深度复制操作通常存在两个问题, 而浅层复制操作并不存在这些问题:

  • 递归对象 (直接或间接包含对自身引用的复合对象) 可能会导致递归循环。

  • 由于深层复制会复制所有内容,因此可能会过多复制(例如本应该在副本之间共享的数据)。

deepcopy() 函数用以下方式避免了这些问题:

  • 保留在当前复制过程中已复制的对象的 “备忘录” (memo) 字典;以及

  • 允许用户定义的类重写复制操作或复制的组件集合。

此模块不会复制模块、方法、栈追踪、栈帧、文件、套接字、窗口以及任何相似的类型。 它会通过不加修改地返回原始对象来(浅层或深层地)“复制”函数和类;这与 pickle 模块处理这类问题的方式是兼容的。

制作字典的浅层复制可以使用 dict.copy() 方法,而制作列表的浅层复制可以通过赋值整个列表的切片完成,例如,copied_list = original_list[:]

类可以使用与控制序列化(pickling)操作相同的接口来控制复制操作,关于这些方法的描述信息请参考 pickle 模块。实际上,copy 模块使用的正是从 copyreg 模块中注册的 pickle 函数。

为了让一个类能够定义它自己的拷贝实现,它可以定义特殊方法 __copy__()__deepcopy__()

object.__copy__(self)

调用以实现浅拷贝操作;无须传入任何额外参数。

object.__deepcopy__(self, memo)

调用以实现深拷贝操作;它将传入一个参数,即 memo 字典。 如果 __deepcopy__ 实现需要创建一个组件的深拷贝,它应当调用 deepcopy() 函数并将该组件作为第一个参数而将 memo 字典作为第二个参数。 memo 字典应当被当作不透明对象来处理。

函数 copy.replace() 相比 copy()deepcopy() 受到更多的限制,并且仅支持由 namedtuple() 创建的元组, dataclasses 及其他定义了 __replace__() 方法的类。

object.__replace__(self, /, **changes)

此函数应当新建一个具有相同类型的对象,使用来自 changes 的值替换字段。

参见

模块 pickle

讨论了支持对象状态检索和恢复的特殊方法。