Tensorflow Tesla instanties benchmark
Samenvatting van testmodelresultaten voor de beeldclassificatie met Tesla LeaderGPU servers
LeaderGPU is een nieuwe speler op de markt van GPU computing en heeft de ambitie om de spelregels te veranderen. Op dit moment bestaat de GPU computing markt uit verschillende grote spelers zoals Amazon AWS, Google Cloud, enz. Maar een grote speler betekent niet altijd het beste marktaanbod. In vergelijking met Amazon AWS en Google Cloud biedt het LeaderGPU project fysieke servers, geen VPS, waar hardwarebronnen gedeeld kunnen worden door tientallen gebruikers.
Tests werden uitgevoerd op de LeaderGPU Tesla reken systemen met synthetische gegevens van de volgende netwerkmodellen: ResNet-50, ResNet-152, VGG16 en AlexNet. Aan het einde van dit artikel vindt u de resultaten van tests uitgevoerd op andere modellen. Het testen van synthetische data gebeurde met behulp van tf.Variabele, analoog aan de modellen geconfigureerd voor ImageNet.
De volgende commando's werden gebruikt om de test uit te voeren:
# git clone https://github.com/tensorflow/benchmarks.git
# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)
LeaderGPU Tesla instanties
- Testomgeving:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
- Soort instantie:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
- GPU's:Nvidia Tesla cards
- Besturingssysteem:CentOS 7
- CUDA / cuDNN:9.0 / 7.0.5
- TensorFlow 1.7 from repo
- Benchmark GitHub hash:9165a70
- Testdatum:25.04.2018
Options | Inception V3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
---|---|---|---|---|---|
Batch size on GPU | 64 | 32 | 64 | 32 | 512 |
Optimization | sgd | sgd | sgd | sgd | sgd |
Testen van synthetische gegevens (afbeeldingen / s)
GPUs | InceptionV3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
---|---|---|---|---|---|
GPUs | InceptionV3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
2x P100 | 268.24 | 224.90 | 446.08 | 150.04 | 5252.43 |
2x PCI V100 | 430.77 | 309.82 | 667.62 | 213.04 | 7545.40 |
2x NVlink V100 | 450.75 | 417.22 | 698.97 | 236.90 | 8786.56 |
Andere resultaten
Testen van synthetische gegevens (afbeeldingen / s)
2x PCI Tesla P100
Batch size | Alexnet | vgg11 | vgg16 | vgg19 | lenet | googlenet |
---|---|---|---|---|---|---|
32 | 1411.48 | 378.47 | 224.90 | 199.87 | 14944.76 | 788.43 |
64 | 2460.54 | 473.82 | 256.68 | 225.58 | 29215.60 | 913.38 |
128 | 3576.26 | 539.08 | 278.83 | 243.67 | 47375.83 | 1035.37 |
256 | 4545.45 | 561.73 | - | - | 67116.75 | 1127.05 |
512 | 5252.43 | - | - | - | 83665.27 | 1165.75 |