save

paddle.jit. save ( layer, path, input_spec=None, **configs ) [源代码]

将输入的 Layerfunction 存储为 paddle.jit.TranslatedLayer 格式的模型,载入后可用于预测推理或者fine-tune训练。

该接口会将输入 Layer 转写后的模型结构 Program 和所有必要的持久参数变量存储至输入路径 path

path 是存储目标的前缀,存储的模型结构 Program 文件的后缀为 .pdmodel ,存储的持久参数变量文件的后缀为 .pdiparams ,同时这里也会将一些变量描述信息存储至文件,文件后缀为 .pdiparams.info ,这些额外的信息将在fine-tune训练中使用。

存储的模型能够被以下API完整地载入使用:

  • paddle.jit.load

  • paddle.static.load_inference_model

  • 其他预测库API

注解

当使用 paddle.jit.save 保存 function 时, function 不能包含参数变量。如果必须保存参数变量,请用Layer封装function,然后按照处理Layer的方式调用相应的API。

参数

  • layer (Layer|function) - 需要存储的 Layer 对象或者 function

  • path (str) - 存储模型的路径前缀。格式为 dirname/file_prefix 或者 file_prefix

  • input_spec (list[InputSpec|Tensor], 可选) - 描述存储模型forward方法的输入,可以通过InputSpec或者示例Tensor进行描述。如果为 None ,所有原 Layer forward方法的输入变量将都会被配置为存储模型的输入变量。默认为 None

  • **configs (dict, 可选) - 其他用于兼容的存储配置选项。这些选项将来可能被移除,如果不是必须使用,不推荐使用这些配置选项。默认为 None。目前支持以下配置选项:(1) output_spec (list[Tensor]) - 选择存储模型的输出目标。默认情况下,所有原 Layer forward方法的返回值均会作为存储模型的输出。如果传入的 output_spec 列表不是所有的输出变量,存储的模型将会根据 output_spec 所包含的结果被裁剪。

返回

代码示例

  1. # example 1: save layer
  2. import numpy as np
  3. import paddle
  4. import paddle.nn as nn
  5. import paddle.optimizer as opt
  6. BATCH_SIZE = 16
  7. BATCH_NUM = 4
  8. EPOCH_NUM = 4
  9. IMAGE_SIZE = 784
  10. CLASS_NUM = 10
  11. # define a random dataset
  12. class RandomDataset(paddle.io.Dataset):
  13. def __init__(self, num_samples):
  14. self.num_samples = num_samples
  15. def __getitem__(self, idx):
  16. image = np.random.random([IMAGE_SIZE]).astype('float32')
  17. label = np.random.randint(0, CLASS_NUM - 1, (1, )).astype('int64')
  18. return image, label
  19. def __len__(self):
  20. return self.num_samples
  21. class LinearNet(nn.Layer):
  22. def __init__(self):
  23. super(LinearNet, self).__init__()
  24. self._linear = nn.Linear(IMAGE_SIZE, CLASS_NUM)
  25. @paddle.jit.to_static
  26. def forward(self, x):
  27. return self._linear(x)
  28. def train(layer, loader, loss_fn, opt):
  29. for epoch_id in range(EPOCH_NUM):
  30. for batch_id, (image, label) in enumerate(loader()):
  31. out = layer(image)
  32. loss = loss_fn(out, label)
  33. loss.backward()
  34. opt.step()
  35. opt.clear_grad()
  36. print("Epoch {} batch {}: loss = {}".format(
  37. epoch_id, batch_id, np.mean(loss.numpy())))
  38. # 1. train & save model.
  39. # create network
  40. layer = LinearNet()
  41. loss_fn = nn.CrossEntropyLoss()
  42. adam = opt.Adam(learning_rate=0.001, parameters=layer.parameters())
  43. # create data loader
  44. dataset = RandomDataset(BATCH_NUM * BATCH_SIZE)
  45. loader = paddle.io.DataLoader(dataset,
  46. batch_size=BATCH_SIZE,
  47. shuffle=True,
  48. drop_last=True,
  49. num_workers=2)
  50. # train
  51. train(layer, loader, loss_fn, adam)
  52. # save
  53. path = "example_model/linear"
  54. paddle.jit.save(layer, path)
  55. # example 2: save function
  56. import paddle
  57. from paddle.static import InputSpec
  58. def save_function():
  59. @paddle.jit.to_static
  60. def fun(inputs):
  61. return paddle.tanh(inputs)
  62. path = 'test_jit_save_load_function_1/func'
  63. inps = paddle.rand([3, 6])
  64. origin = fun(inps)
  65. paddle.jit.save(fun, path)
  66. load_func = paddle.jit.load(path)
  67. load_result = load_func(inps)
  68. print((load_result - origin).abs().max() < 1e-10)
  69. save_function()

使用本API的教程文档