ExecutionStrategy
class paddle.static. ExecutionStrategy
通过设置 ExecutionStrategy
中的选项,用户可以对执行器的执行配置进行调整,比如设置执行器中线程池的大小等。
返回
ExecutionStrategy,一个ExecutionStrategy的实例
代码示例
import paddle
import paddle.static as static
import paddle.nn.functional as F
paddle.enable_static()
x = static.data(name='x', shape=[None, 13], dtype='float32')
y = static.data(name='y', shape=[None, 1], dtype='float32')
y_predict = static.nn.fc(x=x, size=1, activation=None)
cost = F.square_error_cost(input=y_predict, label=y)
avg_loss = paddle.mean(cost)
sgd_optimizer = paddle.optimizer.SGD(learning_rate=0.001)
sgd_optimizer.minimize(avg_loss)
exec_strategy = static.ExecutionStrategy()
exec_strategy.num_threads = 4
train_exe = static.ParallelExecutor(use_cuda=False,
loss_name=avg_loss.name,
exec_strategy=exec_strategy)
num_threads
int型成员。该选项表示当前 Executor
的线程池(thread pool)的大小, 此线程池可用来并发执行program中的operator(算子,运算)。如果
,则所有的operator将一个接一个地执行,但在不同的program重复周期(iterations)中执行顺序可能不同。如果该选项没有被设置,则在 Executor
中,它会依据设备类型(device type)、设备数目(device count)而设置为相应值。对GPU,
;对CPU,
。在 Executor
中有关于 CPU_NUMCPU_NUM 的详细解释。如果没有设置 CPU_NUMCPU_NUM ,则设置默认值为1, 并提示用户进行 CPU_NUMCPU_NUM 的设置。
代码示例
import paddle
import paddle.static as static
paddle.enable_static()
exec_strategy = static.ExecutionStrategy()
exec_strategy.num_threads = 4
num_iteration_per_drop_scope
int型成员。该选项表示间隔多少次迭代之后清理一次临时变量。模型运行过程中,生成的中间临时变量将被放到local execution scope中,为了避免对临时变量频繁的申请与释放,通常将其设为较大的值(比如10或者100)。默认值为100。
注解
如果你调用run的时候fetch了数据,ParallelExecutor将会在本轮迭代结束时清理临时变量。
在一些NLP模型中,这个策略可能会造成的GPU显存不足,此时需要减少num_iteration_per_drop_scope的值。
代码示例
import paddle
import paddle.static as static
paddle.enable_static()
exec_strategy = static.ExecutionStrategy()
exec_strategy.num_iteration_per_drop_scope = 10
num_iteration_per_run
int型成员。它配置了当用户在python脚本中调用pe.run()时执行器会执行的迭代次数。Executor每次调用,会进行num_iteration_per_run次训练,它会使整体执行过程更快。默认值为1。
代码示例
import paddle
import paddle.static as static
paddle.enable_static()
exec_strategy = static.ExecutionStrategy()
exec_strategy.num_iteration_per_run = 10