PaddleCloudRoleMaker

class paddle.distributed.fleet.PaddleCloudRoleMaker [源代码]

PaddleCloudRoleMaker是基于从环境变量中获取分布式相关信息进行分布式配置初始化的接口. 它会自动根据用户在环境变量中的配置进行分布式训练环境初始化,目前PaddleCloudRoleMaker支持ParameterServer分布式训练及Collective分布式训练两种模式的初始化。

代码示例

  1. import os
  2. import paddle.distributed.fleet as fleet
  3. os.environ["PADDLE_PSERVER_NUMS"] = "2"
  4. os.environ["PADDLE_TRAINERS_NUM"] = "2"
  5. os.environ["POD_IP"] = "127.0.0.1"
  6. os.environ["PADDLE_PORT"] = "36001"
  7. os.environ["TRAINING_ROLE"] = "PSERVER"
  8. os.environ["PADDLE_PSERVERS_IP_PORT_LIST"] = \
  9. "127.0.0.1:36001,127.0.0.2:36001"
  10. os.environ["PADDLE_TRAINER_ID"] = "0"
  11. fleet.PaddleCloudRoleMaker(is_collective=False)

to_string ( )

将当前环境变量以字符串的形式输出

返回: string

代码示例:

  1. import paddle.distributed.fleet as fleet
  2. role = fleet.PaddleCloudRoleMaker(is_collective=False)
  3. role.to_string()