TensorRT库性能测试
测试环境
- CPU:Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz GPU:Tesla P4
- TensorRT4.0, CUDA8.0, CUDNNV7
- 测试模型 ResNet50,MobileNet,ResNet101, Inception V3.
测试对象
PaddlePaddle, Pytorch, Tensorflow
- 在测试中,PaddlePaddle使用子图优化的方式集成了TensorRT, 模型地址。
- Pytorch使用了原生的实现, 模型地址1、地址2。
- 对TensorFlow测试包括了对TF的原生的测试,和对TF—TRT的测试,对TF—TRT的测试并没有达到预期的效果,后期会对其进行补充, 模型地址。
ResNet50
batch_size | PaddlePaddle(ms) | Pytorch(ms) | TensorFlow(ms) |
---|
1 | 4.64117 | 16.3 | 10.878 |
5 | 6.90622 | 22.9 | 20.62 |
10 | 7.9758 | 40.6 | 34.36 |
MobileNet
batch_size | PaddlePaddle(ms) | Pytorch(ms) | TensorFlow(ms) |
---|
1 | 1.7541 | 7.8 | 2.72 |
5 | 3.04666 | 7.8 | 3.19 |
10 | 4.19478 | 14.47 | 4.25 |
ResNet101
batch_size | PaddlePaddle(ms) | Pytorch(ms) | TensorFlow(ms) |
---|
1 | 8.95767 | 22.48 | 18.78 |
5 | 12.9811 | 33.88 | 34.84 |
10 | 14.1463 | 61.97 | 57.94 |
Inception v3
batch_size | PaddlePaddle(ms) | Pytorch(ms) | TensorFlow(ms) |
---|
1 | 15.1613 | 24.2 | 19.1 |
5 | 18.5373 | 34.8 | 27.2 |
10 | 19.2781 | 54.8 | 36.7 |
原文: http://paddlepaddle.org/documentation/docs/zh/1.3/advanced_usage/deploy/inference/paddle_gpu_benchmark.html