飞桨框架昆仑XPU版训练示例
使用XPU训练与cpu/gpu相同,只需要加上-o use_xpu=True, 表示执行在昆仑设备上。
ResNet50下载并运行示例:
模型文件下载命令:
cd path_to_clone_PaddleClas
git clone -b release/static https://github.com/PaddlePaddle/PaddleClas.git
也可以访问PaddleClas的github repo直接下载源码。
配置XPU进行训练的命令非常简单:
#FLAGS指定单卡或多卡训练,此示例运行2个卡
export FLAGS_selected_xpus=0,1
#启动训练
python3.7 tools/static/train.py -c configs/quick_start/ResNet50_vd_finetune_kunlun.yaml -o use_gpu=False -o use_xpu=True -o is_distributed=False
如果需要指定更多的卡(比如8卡),需要配置合适的训练参数,可使用如下命令自动修改:
export FLAGS_selected_xpus=0,1,2,3,4,5,6,7
python3.7 -m paddle.distributed.launch
--ips=${ips}
--xpus=${FLAGS_selected_xpus}
--log_dir log
tools/static/train.py
-c ${config_yaml}
-o is_distributed=False
-o epochs=${epochs}
-o TRAIN.batch_size=${total_batch_size}
-o LEARNING_RATE.params.lr=${lr}
-o use_gpu=False
-o use_xpu=True
其他模型的训练示例可在飞桨对昆仑XPU芯片的支持中支持模型列表下的模型链接中找到。