Benchmark Tensorflow™ VGG16

LeaderGPU® è un servizio rivoluzionario che offre un nuovo approccio al mondo del GPU computing. La velocità di calcolo per il modello VGG16 su LeaderGPU® è superiore di 1,8 volte rispetto a Google Cloud e di 1,7 volte rispetto a AWS (dati relativi a un esempio con 8x GTX 1080). Su LeaderGPU®, il costo del leasing della GPU parte da 0,02 euro al minuto, una cifra inferiore di oltre 4 volte rispetto a Google Cloud e di oltre 5 volte rispetto a AWS (dati aggiornati al 7 luglio 2017).

In questo articolo vengono illustrati i risultati dei test per il modello VGG16 con diversi servizi di noleggio di GPU, vale a dire LeaderGPU®, AWS e Google Cloud. I risultati dei test dimostrano che LeaderGPU® è la soluzione più redditizia tra le opzioni considerate.

Tutti i test sono stati svolti utilizzando Python 3.5 e Tensorflow-gpu 1.2 su dispositivi con GTX 1080, GTX 1080 TI e Tesla® P 100, con sistema operativo CentOS 7 e libreria CUDA® 8.0 installati.

Per il test sono stati utilizzanti i seguenti comandi:

# git clone https://github.com/tensorflow/benchmarks.git
# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2(Numero di schede sul server) --model vgg16 --batch_size 32 (64)

Istanze GTX 1080

Nel primo test abbiamo utilizzato le istanze con GTX 1080. Seguono i dati dell'ambiente di test (con batch di dimensioni 32 e 64):

Ambiente di test:

  • Tipi di istanza:ltbv17, ltbv13, ltbv16
  • GPU: 2x GTX 1080, 4x GTX 1080, 8x GTX 1080
  • OS:CentOS 7
  • CUDA / cuDNN:8.0 / 5.1
  • TensorFlow GitHub hash:b1e174e
  • Benchmark GitHub hash:9165a70
  • Comando:
    # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model vgg16 --batch_size 32 (optional 64)
  • Modello:VGG16
  • Data del test:giugno 2017

I risultati del test sono indicati nel seguente grafico:

VGG16 GTX 1080 test results

Istanze GTX 1080TI

Abbiamo quindi testato le istanze con 1080 Ti. Seguono i dati dell'ambiente di test (con batch di dimensioni 32 e 64):

Ambiente di test:

  • Tipi di istanza:ltbv21, ltbv18
  • GPU:2x GTX 1080TI, 4x GTX 1080TI
  • OS:CentOS 7
  • CUDA / cuDNN:8.0 / 5.1
  • TensorFlow GitHub hash:b1e174e
  • Benchmark GitHub hash:9165a70
  • Comando:
    # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 (4) --model vgg16 --batch_size 32 (optional 64)
  • Modello:VGG16
  • Data del test:giugno 2017

I risultati del test sono indicati nel seguente grafico:

VGG16 GTX 1080TI test results

Istanza Tesla® P100

Per concludere, abbiamo testato le istanze con Tesla® P100. Ecco i dati dell'ambiente di test (con batch di dimensioni 32 e 64):

Ambiente di test:

  • Tipo di istanza:ltbv20
  • GPU:2x NVIDIA® Tesla® P100
  • OS:CentOS 7
  • CUDA / cuDNN:8.0 / 5.1
  • TensorFlow GitHub hash:b1e174e
  • Benchmark GitHub hash:9165a70
  • Comando:
    # python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model vgg16 --batch_size 32 (optional 64)
  • Modello:VGG16
  • Data del test:giugno 2017

I risultati del test sono indicati nel seguente grafico:

VGG16 Tesla P100 test results

La seguente tabella mostra i risultati dei test di VGG16 su Google Cloud e AWS:

GPU Google cloud AWS
1x Tesla K80 35.4 36.3
2x Tesla K80 64.8 69.4
4x Tesla K80 120 141
8x Tesla K80 234 260

*I dati forniti sono stati recuperati dalle seguenti fonti:

https://www.tensorflow.org/lite/performance/measurement#details_for_google_compute_engine_nvidia_tesla_k80
https://www.tensorflow.org/lite/performance/measurement#details_for_amazon_ec2_nvidia_tesla_k80

Abbiamo calcolato i costi e i tempi di elaborazione di 1.000.000 di immagini su dispositivi con LeaderGPU®, AWS e Google (i dati sono relativi ai risultati più elevati dei vari dispositivi):

GPU Numero di immagini Tempo Costo al minuto Costo totale
2x GTX 1080 1000000 96m 13sec € 0,03 € 2,89
4x GTX 1080 1000000 60m 17sec € 0,02 € 1,21
8x GTX 1080 1000000 38m 53sec € 0,10 € 3,89
4x GTX 1080TI 1000000 41m 29sec € 0,02 € 0,83
2х Tesla P100 1000000 114m 45sec € 0,02 € 2,30
8x Tesla K80 Google cloud 1000000 71m 12sec € 0,0825** € 4,84
8x Tesla K80 AWS 1000000 64m 6sec € 0,107 € 6,85

*Il servizio Google Cloud non offre piani di pagamento al minuto. Il costo al minuto è stato calcolato sulla base del prezzo orario ($5.645).

Come possiamo osservare nella tabella, la velocità di elaborazione delle immagini con il modello VGG16 è la più elevata su 8x GTX 1080 con LeaderGPU®. Inoltre:

il costo del leasing proposto da LeaderGPU® parte da €0,02 al minuto, inferiore di circa 4,13 volte rispetto alle istanze di 8x Tesla® K80 con Google Cloud e di circa 5,35 volte rispetto alle istanze di 8x Tesla® K80 con AWS;

la velocità di elaborazione è di 38 minuti e 53 secondi, superiore di 1,8 volte rispetto alle istanze di 8x Tesla® K80 con Google Cloud e di 1,7 volte rispetto alle istanze di 8x Tesla® K80 con AWS.

Questi dati dimostrano che LeaderGPU® è una soluzione di gran lunga più redditizia rispetto alla concorrenza, in grado di offrire la massima velocità a prezzi convenienti. Noleggia subito le migliori soluzioni GPU a tariffe flessibili su LeaderGPU®!