Benchmark de instancias Tesla de Tensorflow

Resumen de los resultados del modelo de prueba para la clasificación de imágenes con los servidores Tesla de LeaderGPU

LeaderGPU es un nuevo actor en el mercado de computación GPU, y pretende cambiar las reglas del juego. En este momento, el mercado de computación GPU comprende varios actores grandes como Amazon AWS, Google Cloud, etc. Sin embargo, un gran actor no siempre significa la mejor oferta en el mercado. El proyecto LeaderGPU, en comparación con Amazon AWS y Google Cloud, proporciona servidores físicos, no VPS, donde los recursos de hardware pueden ser compartidos entre varias decenas de usuarios.

Las pruebas se realizaron en los sistemas de computación Tesla de LeaderGPU en datos sintéticos de los siguientes modelos de red: ResNet-50, ResNet-152, VGG16 y AlexNet. Al final de este artículo, encontrará los resultados de las pruebas realizadas en otros modelos. La prueba de datos sintéticos se realizó utilizando tf.Variable en analogía con los modelos configurados para ImageNet.

Los siguientes comandos se utilizaron para ejecutar la prueba:

# git clone https://github.com/tensorflow/benchmarks.git
# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)

Instancias Tesla de LeaderGPU

  • Ambiente de pruebas:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
  • Tipo de instancia:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
  • GPUs:Nvidia Tesla cards
  • SO:CentOS 7
  • CUDA / cuDNN:9.0 / 7.0.5
  • TensorFlow 1.7 from repo
  • Benchmark GitHub hash:9165a70
  • Fecha de la prueba:25.04.2018
Options Inception V3 VGG16 ResNet-50 ResNet-152 Alexnet
Batch size on GPU 64 32 64 32 512
Optimization sgd sgd sgd sgd sgd

picture

Prueba de datos sintéticos (imágenes / s)

GPUs InceptionV3 VGG16 ResNet-50 ResNet-152 Alexnet
GPUs InceptionV3 VGG16 ResNet-50 ResNet-152 Alexnet
2x P100 268.24 224.90 446.08 150.04 5252.43
2x PCI V100 430.77 309.82 667.62 213.04 7545.40
2x NVlink V100 450.75 417.22 698.97 236.90 8786.56

Otros resultados

Prueba de datos sintéticos (imágenes / s)

2x PCI Tesla P100

Batch size Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1411.48 378.47 224.90 199.87 14944.76 788.43
64 2460.54 473.82 256.68 225.58 29215.60 913.38
128 3576.26 539.08 278.83 243.67 47375.83 1035.37
256 4545.45 561.73 - - 67116.75 1127.05
512 5252.43 - - - 83665.27 1165.75
Batch size overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 548.55 248.72 122.22 389.73 220.26 150.04
64 952.51 268.24 133.96 446.08 253.86 176.09
128 1437.54 283.39 - 483.51 - -
256 1847.21 - - - - -
512 2186.47 - - - - -

2x PCI Tesla V100

Batch size Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1665.82 526.55 309.82 282.81 17583.47 1268.95
64 3056.89 695.42 374.22 331.41 32271.30 1487.77
128 4660.06 831.39 410.27 360.79 62652.62 1704.92
256 6255.16 729.42 - - 98828.17 1921.02
512 7545.40 - - - 136553.56 2039.60
Batch size overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 625.35 371.94 186.38 579.01 318.30 213.04
64 1194.50 430.77 210.41 667.62 379.37 259.16
128 1934.71 462.09 - 746.73 - -
256 2690.65 - - - - -
512 3267.15 - - - - -

2x NVlink Tesla V100

Batch size Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 3743.79 775.95 417.22 360.08 12460.77 1250.49
64 5514.97 904.65 447.46 386.92 28038.87 1546.01
128 6990.88 982.62 465.05 401.43 50064.03 1791.36
256 7960.86 805.59 - - 94842.75 1895.35
512 8786.56 - - - 131914.42 2158.45
Batch size overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 1404.21 397.70 195.51 602.97 341.20 236.90
64 2216.08 450.75 220.00 698.97 395.01 272.37
128 3005.20 475.38 - 781.50 - -
256 3656.48 - - - - -
512 4073.38 - - - - -