飞桨框架昆仑XPU版训练示例

使用XPU训练与cpu/gpu相同,只需要加上-o use_xpu=True, 表示执行在昆仑设备上。

ResNet50下载并运行示例:

模型文件下载命令:

  1. cd path_to_clone_PaddleClas
  2. git clone -b release/static https://github.com/PaddlePaddle/PaddleClas.git

也可以访问PaddleClas的github repo直接下载源码。

配置XPU进行训练的命令非常简单:

  1. #FLAGS指定单卡或多卡训练,此示例运行2个卡
  2. export FLAGS_selected_xpus=0,1
  3. #启动训练
  4. python3.7 tools/static/train.py -c configs/quick_start/ResNet50_vd_finetune_kunlun.yaml -o use_gpu=False -o use_xpu=True -o is_distributed=False

如果需要指定更多的卡(比如8卡),需要配置合适的训练参数,可使用如下命令自动修改:

  1. export FLAGS_selected_xpus=0,1,2,3,4,5,6,7
  2. python3.7 -m paddle.distributed.launch
  3. --ips=${ips}
  4. --xpus=${FLAGS_selected_xpus}
  5. --log_dir log
  6. tools/static/train.py
  7. -c ${config_yaml}
  8. -o is_distributed=False
  9. -o epochs=${epochs}
  10. -o TRAIN.batch_size=${total_batch_size}
  11. -o LEARNING_RATE.params.lr=${lr}
  12. -o use_gpu=False
  13. -o use_xpu=True

其他模型的训练示例可在飞桨对昆仑XPU芯片的支持中支持模型列表下的模型链接中找到。