Tensorflow Tesla Instanzen Benchmark

Zusammenfassung der Testmodell-Ergebnisse für die Bildklassifizierung mit Tesla LeaderGPU-Servern

LeaderGPU ist ein neuer Akteur auf dem Markt für GPU-Computing und beabsichtigt, die Spielregeln zu ändern. Derzeit besteht der Markt für GPU-Computing aus mehreren großen Akteuren wie Amazon AWS, Google Cloud usw. Ein großer Akteur bedeutet jedoch nicht immer das beste Marktangebot. Das LeaderGPU-Projekt bietet im Vergleich zu Amazon AWS und Google Cloud physische Server, keine VPS, bei denen Hardware-Ressourcen unter mehreren Dutzend Benutzern geteilt werden können.

Die Tests wurden auf den LeaderGPU Tesla-Rechensystemen mit synthetischen Daten der folgenden Netzwerkmodelle durchgeführt: ResNet-50, ResNet-152, VGG16 und AlexNet. Am Ende dieses Artikels finden Sie die Ergebnisse von Tests, die mit anderen Modellen durchgeführt wurden. Das Testen von synthetischen Daten wurde mit tf.Variable in Analogie zu den für ImageNet konfigurierten Modellen durchgeführt.

Die folgenden Befehle wurden verwendet, um den Test auszuführen:

# git clone https://github.com/tensorflow/benchmarks.git

# python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)

LeaderGPU Tesla Instanzen

Testumgebung:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
Instanztyp:2 x Tesla P100 PCI (ltbv32), 2 x Tesla V100 PCI (ltbv20), 2 x Tesla V100 NVLink (ltbv46)
GPUs:Nvidia Tesla cards
Betriebssystem:CentOS 7
CUDA / cuDNN:9.0 / 7.0.5
TensorFlow 1.7 from repo
Benchmark GitHub Hash:9165a70
Datum des Tests:25.04.2018

Options	Inception V3	VGG16	ResNet-50	ResNet-152	Alexnet
Batch size on GPU	64	32	64	32	512
Optimization	sgd	sgd	sgd	sgd	sgd

Testen von synthetischen Daten (Bilder / s)

GPUs	InceptionV3	VGG16	ResNet-50	ResNet-152	Alexnet
GPUs	InceptionV3	VGG16	ResNet-50	ResNet-152	Alexnet
2x P100	268.24	224.90	446.08	150.04	5252.43
2x PCI V100	430.77	309.82	667.62	213.04	7545.40
2x NVlink V100	450.75	417.22	698.97	236.90	8786.56

Andere Ergebnisse

Testen von synthetischen Daten (Bilder / s)

2x PCI Tesla P100

Batch size	Alexnet	vgg11	vgg16	vgg19	lenet	googlenet
32	1411.48	378.47	224.90	199.87	14944.76	788.43
64	2460.54	473.82	256.68	225.58	29215.60	913.38
128	3576.26	539.08	278.83	243.67	47375.83	1035.37
256	4545.45	561.73	-	-	67116.75	1127.05
512	5252.43	-	-	-	83665.27	1165.75
Batch size	overfeat	inceptionv3	inception4	resnet50	resnet101	resnet152
32	548.55	248.72	122.22	389.73	220.26	150.04
64	952.51	268.24	133.96	446.08	253.86	176.09
128	1437.54	283.39	-	483.51	-	-
256	1847.21	-	-	-	-	-
512	2186.47	-	-	-	-	-

2x PCI Tesla V100

Batch size	Alexnet	vgg11	vgg16	vgg19	lenet	googlenet
32	1665.82	526.55	309.82	282.81	17583.47	1268.95
64	3056.89	695.42	374.22	331.41	32271.30	1487.77
128	4660.06	831.39	410.27	360.79	62652.62	1704.92
256	6255.16	729.42	-	-	98828.17	1921.02
512	7545.40	-	-	-	136553.56	2039.60
Batch size	overfeat	inceptionv3	inception4	resnet50	resnet101	resnet152
32	625.35	371.94	186.38	579.01	318.30	213.04
64	1194.50	430.77	210.41	667.62	379.37	259.16
128	1934.71	462.09	-	746.73	-	-
256	2690.65	-	-	-	-	-
512	3267.15	-	-	-	-	-

2x NVlink Tesla V100

Batch size	Alexnet	vgg11	vgg16	vgg19	lenet	googlenet
32	3743.79	775.95	417.22	360.08	12460.77	1250.49
64	5514.97	904.65	447.46	386.92	28038.87	1546.01
128	6990.88	982.62	465.05	401.43	50064.03	1791.36
256	7960.86	805.59	-	-	94842.75	1895.35
512	8786.56	-	-	-	131914.42	2158.45
Batch size	overfeat	inceptionv3	inception4	resnet50	resnet101	resnet152
32	1404.21	397.70	195.51	602.97	341.20	236.90
64	2216.08	450.75	220.00	698.97	395.01	272.37
128	3005.20	475.38	-	781.50	-	-
256	3656.48	-	-	-	-	-
512	4073.38	-	-	-	-	-