- 分布式
- FLAGS_communicator_fake_rpc
- FLAGS_communicator_independent_recv_thread
- FLAGS_communicator_max_merge_var_num
- FLAGS_communicator_merge_sparse_grad
- FLAGS_communicator_min_send_grad_num_before_recv
- FLAGS_communicator_send_queue_size
- FLAGS_communicator_send_wait_times
- FLAGS_communicator_thread_pool_size
- FLAGS_dist_threadpool_size
- FLAGS_rpc_deadline
- FLAGS_rpc_disable_reuse_port
- FLAGS_rpc_get_thread_num
- FLAGS_rpc_send_thread_num
- FLAGS_rpc_server_profile_path
分布式
FLAGS_communicator_fake_rpc
(始于1.5.0)
当设为True时,通信器不会实际进行rpc调用,因此速度不会受到网络通信的影响。该flag用于调试。
取值范围
Bool型,缺省值为False。
示例
FLAGS_communicator_fake_rpc=True - 启用通信器fake模式。
注意
该flag仅用于paddlepaddle的开发者,普通用户不应对其设置。
FLAGS_communicator_independent_recv_thread
(始于1.5.0)
使用独立线程以从参数服务器接收参数。
取值范围
Bool型,缺省值为True。
示例
FLAGS_communicator_independent_recv_thread=True - 使用独立线程以从参数服务器接收参数。
注意
开发者使用该flag进行框架的调试与优化,普通用户不应对其设置。
FLAGS_communicator_max_merge_var_num
(始于1.5.0)
要通过通信器合并为一个梯度并发送的最大梯度数。训练器将所有梯度放入队列,然后通信器将从队列中取出梯度并在合并后发送。
取值范围
Int32型,缺省值为20。
示例
FLAGS_communicator_max_merge_var_num=16 - 将要通过通信器合并为一个梯度并发送的最大梯度数设为16。
注意
该flag和训练器线程数有着密切关联,缺省值应和线程数一致。
FLAGS_communicator_merge_sparse_grad
(始于1.5.0)
在发送之前,合并稀疏梯度。
取值范围
Bool型,缺省值true。
示例
FLAGS_communicator_merge_sparse_grad=true - 设置合并稀疏梯度。
注意
合并稀疏梯度会耗费时间。如果重复ID较多,内存占用会变少,通信会变快;如果重复ID较少,则并不会节约内存。
FLAGS_communicator_min_send_grad_num_before_recv
(始于1.5.0)
在通信器中,有一个发送线程向参数服务器发送梯度,一个接收线程从参数服务器接收参数,且它们之间彼此独立。该flag用于控制接收线程的频率。 仅当发送线程至少发送FLAGS_communicator_min_send_grad_num_before_recv数量的梯度时,接收线程才会从参数服务器接收参数。
取值范围
Int32型,缺省值为20。
示例
FLAGS_communicator_min_send_grad_num_before_recv=10 - 在接收线程从参数服务器接收参数之前,发送线程发送的梯度数为10。
注意
由于该flag和训练器的训练线程数强相关,而每个训练线程都会发送其梯度,所以缺省值应和线程数一致。
FLAGS_communicator_send_queue_size
(始于1.5.0)
每个梯度的队列大小。训练器将梯度放入队列,然后通信器将其从队列中取出并发送出去。 当通信器很慢时,队列可能会满,训练器在队列有空间之前被持续阻塞。它用于避免训练比通信快得多,以致太多的梯度没有及时发出的情况。
取值范围
Int32型,缺省值为20。
示例
FLAGS_communicator_send_queue_size=10 - 设置每个梯度的队列大小为10。
注意
该flag会影响训练速度,若队列大小过大,速度会变快但结果可能会变差。
FLAGS_communicator_send_wait_times
(始于1.5.0)
合并数没有达到max_merge_var_num的情况下发送线程等待的次数。
取值范围
Int32型,缺省值为5。
示例
FLAGS_communicator_send_wait_times=5 - 将合并数没有达到max_merge_var_num的情况下发送线程等待的次数设为5。
FLAGS_communicator_thread_pool_size
(始于1.5.0)
设置用于发送梯度和接收参数的线程池大小。
取值范围
Int32型,缺省值为5。
示例
FLAGS_communicator_thread_pool_size=10 - 设置线程池大小为10。
注意
大部分情况下,用户不需要设置该flag。
FLAGS_dist_threadpool_size
(始于1.0.0)
控制用于分布式模块的线程数。如果未设置,则将其设置为硬线程。
取值范围
Int32型,缺省值为0。
示例
FLAGS_dist_threadpool_size=10 - 将用于分布式模块的最大线程数设为10。
FLAGS_rpc_deadline
(始于1.0.0)
它控制rpc通信的deadline超时。
取值范围
Int32型,缺省值为180000,单位为ms。
示例
FLAGS_rpc_deadline=180000 - 将deadline超时设为3分钟。
FLAGS_rpc_disable_reuse_port
(始于1.2.0)
FLAGS_rpc_disable_reuse_port为True时,grpc的 GRPC_ARG_ALLOW_REUSEPORT会被设置为False以禁用SO_REUSEPORT。
取值范围
Bool型,缺省值为False。
示例
FLAGS_rpc_disable_reuse_port=True - 禁用SO_REUSEPORT。
FLAGS_rpc_get_thread_num
(始于1.0.0)
它控制用于从参数服务器获取参数的线程数。
取值范围
Int32型,缺省值为12。
示例
FLAGS_rpc_get_thread_num=6 - 将从参数服务器获取参数的线程数设为6。
FLAGS_rpc_send_thread_num
(始于1.0.0)
它控制用于发送rpc的线程数。
取值范围
Int32型,缺省值为12。
示例
FLAGS_rpc_send_thread_num=6 - 将用于发送的线程数设为6。
FLAGS_rpc_server_profile_path
since(v0.15.0)
设置分析器输出日志文件路径前缀。完整路径为FLAGS_rpc_server_profile_path_listener_id,其中listener_id为随机数。
取值范围
String型,缺省值为"./profile_ps"。
示例
FLAGS_rpc_server_profile_path="/tmp/pserver_profile_log" - 在"/tmp/pserver_profile_log_listener_id"中生成配置日志文件。