Porównanie danych technicznych i wydajności kart NVIDIA

 

RTX A6000 RTX A5000 RTX A4000 A40 A10 A16 A100 A30 Quadro
RTX 8000
Quadro
RTX 8000 Passive
Quadro
RTX 6000
Quadro
RTX 6000 Passive
Quadro
RTX 5000
Quadro
RTX 4000
V100S T4
Przeznaczenie Wirtualizacja / Visual Computing CAD 3D / wizualizacja CAD 3D / wizualizacja Wirtualizacja / Visual Computing Wirtualizacja / Visual Computing Wirtualizacja / Visual Computing HPC / AI HPC / AI / Wirtualizacja CAD 3D / wizualizacja Data Center CAD 3D / wizualizacja Data Center CAD 3D / wizualizacja CAD 3D / wizualizacja HPC / AI AI
GPU Amper GA102 Amper GA102 Amper GA104 Ampere GA102 Ampere GA102 Ampere GA107 x4 Ampere GA100 Ampere GA100 Turing TU102 Turing TU102 Turing TU102 Turing TU102 Turing TU104 Turing TU Volta GV100 Turing TU104
Liczba rdzeni CUDA 10752 8192 6144 10752 9216 2560 x4 6912 (3 Gen) 3804 (3 Gen) 4608 4608 4608 4608 3072 2304 5120 2560
Liczba rdzeni Tensor 336 256 192 336 288 80 x4 432 224 576 576 576 576 384 288 640 320
Liczba rdzeni RTX 84 (2 Gen) 64 (2 Gen) 48 (2 Gen) 84 (2 Gen) 72 (2 Gen) 20 x4 (2 Gen) 72 72 72 72 48 36 40
Pamięć 48 GB
GDDR6 384-bit
24 GB
GDDR6 384-bit
16 GB
GDDR6 256-bit
48 GB
GDDR6 384-bit
24 GB
DDR6
16 GB x4
DDR6
40 GB
HBM2
24 GB
HBM2
48 GB
GDDR6
48 GB
GDDR6
24 GB
GDDR6
24 GB
GDDR6
16 GB
GDDR6
8 GB
GDDR6
32 GB
HBM2
16 GB
GDDR6
ECC Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak
Wydajność rdzeni RT
(GPU Boost Clock)
75,6 TFLOPS 54,2 TFLOPS 37,4 TFLOPS 75,6 TFLOPS TBD TBD 84 Tera RTX-Ops 80 Tera RTX-Ops 84 Tera RTX-Ops 80 Tera RTX-Ops 62 Tera RTX-Ops 43 Tera RTX-Ops TBD
Wydajność rdzeni Tensor
(GPU Boost Clock)
309,7 TFLOPS *) 222,2 TFLOPS *) 153,4 TFLOPS *) 309,7 TFLOPS *) TBD TBD 156 TFLOPS /312 TFLOPS *) TBD 130,5 TFLOPS 119,4 TFLOPS 130,5 TFLOPS 119,4 TFLOPS 89,2 TFLOPS 57 TFLOPS 130 TFLOPS 65 TFLOPS
Wydajność FP64
(GPU Boost Clock)
9,7 TFLOPS / 19,5 TFLOPS 1) 5,2 TFLOPS / 10,3 TFLOPS 1) 8,2 TFLOPS
Wydajność FP32
(GPU Boost Clock)
38,7 TFLOPS 27,8 TFLOPS 19,17 TFLOPS 38,7 TFLOPS 31,2 TFLOPS / 62,5 TFLOPS 1) / 125 TFLOPS 1*) 8,6 TFLOPS x4 19,5 TFLOPS / 156 TFLOPS 2) / 312 TFLOPS 2*) 10,3 TFLOPS / 82 TFLOPS 1) / 165 TFLOPS 1*) 16,3 TFLOPS 14,9 TFLOPS 16,3 TFLOPS 14,9 TFLOPS 11,2 TFLOPS 7,1 TFLOPS 16,4 TFLOPS 8,1 TFLOPS
Wydajność FP16
(GPU Boost Clock)
38,7 TFLOPS 27,8 TFLOPS 19,17 TFLOPS 38,7 TFLOPS 125 TFLOPS 1)/ 250 TFLOPS 1*) 8,6 TFLOPS x4 78 TFLOPS / 624 TFLOPS *) 165 TFLOPS 1)/ 330 TFLOPS 1*) 32,6 TFLOPS 29,9 TFLOPS 32,6 TFLOPS 29,9 TFLOPS 22,3 TFLOPS 14,2 TFLOPS 31,4 TFLOPS 16 TFLOPS
Wydajność INT8 TBD TBD TBD TBD 250 TOPS 1)/ 500 TOPS 1*) TBD 624 TOPS / 1248 TOPS *) 330 TOPS 1)/ 661 TOPS 1*) 261 TOPS 238,9 TOPS 261 TOPS 238,9 TOPS 178,4 TOPS 28,5 TOPS 130 TOPS
Wydajność INT4 TBD TBD TBD TBD 500 TOPS 1) / 1000 TOPS 1*) TBD 1248 TOPS / 2496 TOPS *) 661 TOPS 1) / 1321 TOPS 1*) 522 TOPS 477,8 TOPS 522 TOPS 477,8 TOPS 356,8 TOPS 57 TOPS 260 TOPS
Chłodzenie aktywne aktywne aktywne pasywne pasywne pasywne pasywne pasywne aktywne pasywne aktywne pasywne aktywne aktywne pasywne pasywne
NVLink 112,5 GB/s 112,5 GB/s 112,5 GB/s 600 GB/s 200 GB/s 100 GB/s 100 GB/s 100 GB/s 100 GB/s 50 GB/s
Obsługa wyświetlaczy 4x DP 1.4 4x DP 1.4 4x DP 1.4 3x DP 1.4 4x DP 1.4
+ VLink
4x DP 1.4
+ VLink
4x DP 1.4
+ VLink
3x DP 1.4
+ VLink
Szyna PCIe 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16  3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 x8
Max. pobór mocy 300 W 230 W 140 W 300 W 150 W 250 W 250 W 165 W 295 W 250 W 295 W 250 W 265 W 160 W 250 W 70 W
*) z funkcją Sparsity
1)  na rdzeniach tensorowych
2)  TP32 Tensor Float
WordPress Appliance - Powered by TurnKey Linux