Benchmark de instancias Tesla de Tensorflow
Resumen de los resultados del modelo de prueba para la clasificación de imágenes con los servidores Tesla de LeaderGPU
LeaderGPU es un nuevo actor en el mercado de computación GPU, y pretende cambiar las reglas del juego. En este momento, el mercado de computación GPU comprende varios actores grandes como Amazon AWS, Google Cloud, etc. Sin embargo, un gran actor no siempre significa la mejor oferta en el mercado. El proyecto LeaderGPU, en comparación con Amazon AWS y Google Cloud, proporciona servidores físicos, no VPS, donde los recursos de hardware pueden ser compartidos entre varias decenas de usuarios.
Las pruebas se realizaron en los sistemas de computación Tesla de LeaderGPU en datos sintéticos de los siguientes modelos de red: ResNet-50, ResNet-152, VGG16 y AlexNet. Al final de este artículo, encontrará los resultados de las pruebas realizadas en otros modelos. La prueba de datos sintéticos se realizó utilizando tf.Variable en analogía con los modelos configurados para ImageNet.
Los siguientes comandos se utilizaron para ejecutar la prueba:
# git clone https://github.com/tensorflow/benchmarks.git
# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)
Instancias Tesla de LeaderGPU
- Ambiente de pruebas:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
- Tipo de instancia:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
- GPUs:Nvidia Tesla cards
- SO:CentOS 7
- CUDA / cuDNN:9.0 / 7.0.5
- TensorFlow 1.7 from repo
- Benchmark GitHub hash:9165a70
- Fecha de la prueba:25.04.2018
Options | Inception V3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
---|---|---|---|---|---|
Batch size on GPU | 64 | 32 | 64 | 32 | 512 |
Optimization | sgd | sgd | sgd | sgd | sgd |
Prueba de datos sintéticos (imágenes / s)
GPUs | InceptionV3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
---|---|---|---|---|---|
GPUs | InceptionV3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
2x P100 | 268.24 | 224.90 | 446.08 | 150.04 | 5252.43 |
2x PCI V100 | 430.77 | 309.82 | 667.62 | 213.04 | 7545.40 |
2x NVlink V100 | 450.75 | 417.22 | 698.97 | 236.90 | 8786.56 |
Otros resultados
Prueba de datos sintéticos (imágenes / s)
2x PCI Tesla P100
Batch size | Alexnet | vgg11 | vgg16 | vgg19 | lenet | googlenet |
---|---|---|---|---|---|---|
32 | 1411.48 | 378.47 | 224.90 | 199.87 | 14944.76 | 788.43 |
64 | 2460.54 | 473.82 | 256.68 | 225.58 | 29215.60 | 913.38 |
128 | 3576.26 | 539.08 | 278.83 | 243.67 | 47375.83 | 1035.37 |
256 | 4545.45 | 561.73 | - | - | 67116.75 | 1127.05 |
512 | 5252.43 | - | - | - | 83665.27 | 1165.75 |