Tensorflow Tesla Instanzen Benchmark
Zusammenfassung der Testmodell-Ergebnisse für die Bildklassifizierung mit Tesla LeaderGPU-Servern
LeaderGPU ist ein neuer Akteur auf dem Markt für GPU-Computing und beabsichtigt, die Spielregeln zu ändern. Derzeit besteht der Markt für GPU-Computing aus mehreren großen Akteuren wie Amazon AWS, Google Cloud usw. Ein großer Akteur bedeutet jedoch nicht immer das beste Marktangebot. Das LeaderGPU-Projekt bietet im Vergleich zu Amazon AWS und Google Cloud physische Server, keine VPS, bei denen Hardware-Ressourcen unter mehreren Dutzend Benutzern geteilt werden können.
Die Tests wurden auf den LeaderGPU Tesla-Rechensystemen mit synthetischen Daten der folgenden Netzwerkmodelle durchgeführt: ResNet-50, ResNet-152, VGG16 und AlexNet. Am Ende dieses Artikels finden Sie die Ergebnisse von Tests, die mit anderen Modellen durchgeführt wurden. Das Testen von synthetischen Daten wurde mit tf.Variable in Analogie zu den für ImageNet konfigurierten Modellen durchgeführt.
Die folgenden Befehle wurden verwendet, um den Test auszuführen:
# git clone https://github.com/tensorflow/benchmarks.git
# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)
LeaderGPU Tesla Instanzen
- Testumgebung:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
- Instanztyp:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
- GPUs:Nvidia Tesla cards
- Betriebssystem:CentOS 7
- CUDA / cuDNN:9.0 / 7.0.5
- TensorFlow 1.7 from repo
- Benchmark GitHub Hash:9165a70
- Datum des Tests:25.04.2018
Options | Inception V3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
---|---|---|---|---|---|
Batch size on GPU | 64 | 32 | 64 | 32 | 512 |
Optimization | sgd | sgd | sgd | sgd | sgd |
Testen von synthetischen Daten (Bilder / s)
GPUs | InceptionV3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
---|---|---|---|---|---|
GPUs | InceptionV3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
2x P100 | 268.24 | 224.90 | 446.08 | 150.04 | 5252.43 |
2x PCI V100 | 430.77 | 309.82 | 667.62 | 213.04 | 7545.40 |
2x NVlink V100 | 450.75 | 417.22 | 698.97 | 236.90 | 8786.56 |
Andere Ergebnisse
Testen von synthetischen Daten (Bilder / s)
2x PCI Tesla P100
Batch size | Alexnet | vgg11 | vgg16 | vgg19 | lenet | googlenet |
---|---|---|---|---|---|---|
32 | 1411.48 | 378.47 | 224.90 | 199.87 | 14944.76 | 788.43 |
64 | 2460.54 | 473.82 | 256.68 | 225.58 | 29215.60 | 913.38 |
128 | 3576.26 | 539.08 | 278.83 | 243.67 | 47375.83 | 1035.37 |
256 | 4545.45 | 561.73 | - | - | 67116.75 | 1127.05 |
512 | 5252.43 | - | - | - | 83665.27 | 1165.75 |