飞桨对昆仑XPU芯片的支持
自飞桨2.0版本起支持昆仑XPU,目前基于昆仑XPU和X86(Intel)CPU可实现12个模型单机单卡/单机多卡的训练,如下图所示:
模型 | 领域 | 模型readme | 编程范式 | 可用的CPU类型 | 单机多卡支持 |
---|---|---|---|---|---|
VGG16/19 | 图像分类 | 模型链接 | 静态图 | X86(Intel) | 支持 |
ResNet50 | 图像分类 | 模型链接 | 静态图 | X86(Intel)ARM(飞腾) | 支持 |
MobileNet_v3 | 图像分类 | 模型链接 | 静态图 | X86(Intel) | 支持 |
HRNet | 图像分类 | 模型链接 | 静态图 | X86(Intel) | 支持 |
Yolov3-DarkNet53 | 目标检测 | 模型链接 | 静态图 | X86(Intel) | 支持 |
Yolov3-MobileNetv1 | 目标检测 | 模型链接 | 静态图 | X86(Intel) | 支持 |
Mask_RCNN | 目标检测 | 模型链接 | 静态图 | X86(Intel) | 支持 |
Deeplab_v3 | 图像分割 | 模型链接 | 静态图 | X86(Intel) | 支持 |
Unet | 图像分割 | 模型链接 | 静态图 | X86(Intel) | 支持 |
Bert-Base | NLP | 模型链接 | 静态图/动态图 | X86(Intel) | 支持(静态图) |
Ernie-Base | NLP | 静态图/动态图 | X86(Intel) | 支持(静态图) | |
DQN | 强化学习 | 模型链接 | 静态图 | X86(Intel) | 支持 |
模型放置在飞桨模型套件中,各领域套件是 github.com/PaddlePaddle 下的独立repo,clone下载即可获取所需的模型文件:
领域 | 套件名称 | 分支/版本 |
---|---|---|
图像分类 | PaddleClas | release/2.0 |
目标检测 | PaddleDetection | release/2.0-beta |
图像分割 | PaddleSeg | release/2.0-beta |
NLP | models | develop |
强化学习 | PARL | r1.4 |
随着ARM架构的高性能、低功耗、低成本的优势日益突显,ARM CPU更多地进入PC和服务器领域,众多新锐国产CPU也纷纷采用ARM架构。在这一趋势下,我们开始尝试在飞腾CPU和昆仑XPU上运行飞桨,当前已验证ResNet50的训练效果。
更多的常用模型以及动态图组网将在后续版本增加。高性能预测库PaddleInference、PaddleLite、PaddleServing将在近期发布的新版本中支持昆仑XPU。敬请期待。