Porównanie danych technicznych i wydajności kart NVIDIA

 

RTX A6000 RTX A5000 RTX A4500 RTX A4000 RTX A2000 A40 A10 A16 A2 A100 A30 Quadro
RTX 8000
Quadro
RTX 8000 Passive
Quadro
RTX 6000
Quadro
RTX 6000 Passive
Quadro
RTX 5000
Quadro
RTX 4000
V100S T4
Przeznaczenie Wirtualizacja / Visual Computing CAD 3D / wizualizacja CAD 3D / wizualizacja CAD 3D / wizualizacja CAD 3D / wizualizacja Wirtualizacja / Visual Computing Wirtualizacja / Visual Computing Wirtualizacja / Visual Computing AI Inferencing HPC / AI HPC / AI / Wirtualizacja CAD 3D / wizualizacja Data Center CAD 3D / wizualizacja Data Center CAD 3D / wizualizacja CAD 3D / wizualizacja HPC / AI AI
GPU Amper GA102 Amper GA102 Amper GA102 Amper GA104 Amper GA106 Ampere GA102 Ampere GA102 Ampere GA107 x4 Ampere GA107 Ampere GA100 Ampere GA100 Turing TU102 Turing TU102 Turing TU102 Turing TU102 Turing TU104 Turing TU Volta GV100 Turing TU104
Liczba rdzeni CUDA 10752 8192 7168 6144 3328 10752 9216 1280 x4 1280 6912 (3 Gen) 3804 (3 Gen) 4608 4608 4608 4608 3072 2304 5120 2560
Liczba rdzeni Tensor 336 (3 Gen) 256 (3 Gen) 224 (3 Gen) 192 (3 Gen) 104 (3 Gen) 336 288 40 x4 40 432 224 576 576 576 576 384 288 640 320
Liczba rdzeni RTX 84 (2 Gen) 64 (2 Gen) 56 (2 Gen) 48 (2 Gen) 26 (2 Gen) 84 (2 Gen) 72 (2 Gen) 10 x4 (2 Gen) 10 (2 Gen) 72 72 72 72 48 36 40
Pamięć 48 GB
GDDR6 384-bit
24 GB
GDDR6 384-bit
20 GB
GDDR6 320-bit
16 GB
GDDR6 256-bit
6 / 12 GB
GDDR6 192-bit
48 GB
GDDR6 384-bit
24 GB
DDR6
16 GB x4
DDR6
16 GB
DDR6
40 GB
HBM2
24 GB
HBM2
48 GB
GDDR6
48 GB
GDDR6
24 GB
GDDR6
24 GB
GDDR6
16 GB
GDDR6
8 GB
GDDR6
32 GB
HBM2
16 GB
GDDR6
ECC Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak Tak
Wydajność rdzeni RT
(GPU Boost Clock)
75,6 TFLOPS 54,2 TFLOPS 46,2 TFLOPS 37,4 TFLOPS 15,6 TFLOPS 75,6 TFLOPS TBD TBD TBD 84 Tera RTX-Ops 80 Tera RTX-Ops 84 Tera RTX-Ops 80 Tera RTX-Ops 62 Tera RTX-Ops 43 Tera RTX-Ops TBD
Wydajność FP64
(GPU Boost Clock)
9,7 / 19,51) TFLOPS 5,2 / 10,31) TFLOPS 8,2 TFLOPS
Wydajność FP32
(GPU Boost Clock)
38,7 TFLOPS 27,8 TFLOPS 23,7 TFLOPS 19,17 TFLOPS 8,0 TFLOPS 38,7 TFLOPS 31,2 / 62,51) / 1251*) TFLOPS 4,5 x4 / 91) x4 / 181*) x4 TFLOPS 4,5 / 91) / 181*) TFLOPS 19,5 / 1562) / 3122*) TFLOPS 10,3 / 821) / 1651*) TFLOPS 16,3 TFLOPS 14,9 TFLOPS 16,3 TFLOPS 14,9 TFLOPS 11,2 TFLOPS 7,1 TFLOPS 16,4 TFLOPS 8,1 TFLOPS
Wydajność FP16
(GPU Boost Clock)
38,7 TFLOPS 27,8 TFLOPS TBD 19,17 TFLOPS TBD 38,7 TFLOPS 1251)/ 2501*) TFLOPS 17,91) x4 / 35,91*) x4 TFLOPS 17,91) / 35,91*) TFLOPS 78 / 624*) TFLOPS 1651)/ 3301*) TFLOPS 32,6 TFLOPS 29,9 TFLOPS 32,6 TFLOPS 29,9 TFLOPS 22,3 TFLOPS 14,2 TFLOPS 31,4 TFLOPS 16 TFLOPS
Wydajność INT8 TBD TBD TBD TBD TBD TBD 2501)/ 5001*) TOPS 35,91) x4/ 71,81*) x4 TOPS 35,91) / 71,81*) TOPS 624 / 1248*) TOPS 3301)/ 6611*) TOPS 261 TOPS 238,9 TOPS 261 TOPS 238,9 TOPS 178,4 TOPS 28,5 TOPS 130 TOPS
Wydajność INT4 TBD TBD TBD TBD TBD TBD 5001) / 10001*) TOPS TBD 721) / 1441*) TOPS 1248 / 2496*) TOPS 6611) / 13211*) TOPS 522 TOPS 477,8 TOPS 522 TOPS 477,8 TOPS 356,8 TOPS 57 TOPS 260 TOPS
Chłodzenie aktywne aktywne aktywne aktywne aktywne pasywne pasywne pasywne  pasywne  pasywne pasywne aktywne  pasywne aktywne  pasywne aktywne aktywne  pasywne  pasywne
NVLink 112,5 GB/s 112,5 GB/s 112,5 GB/s 112,5 GB/s 600 GB/s 200 GB/s 100 GB/s 100 GB/s 100 GB/s 100 GB/s 50 GB/s
Obsługa wyświetlaczy 4x DP 1.4 4x DP 1.4 4x DP 1.4 4x DP 1.4 4x DP 1.4 3x DP 1.4 4x DP 1.4
+ VLink
4x DP 1.4
+ VLink
4x DP 1.4
+ VLink
3x DP 1.4
+ VLink
Szyna PCIe 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x16 4.0 x8 4.0 x16 4.0 x16  3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 3.0 x16 x8
Max. pobór mocy 300 W 230 W 200 W 140 W 70 W 300 W 150 W 250 W 40 – 60 W 250 W 165 W 295 W 250 W 295 W 250 W 265 W 160 W 250 W 70 W
*) z funkcją Sparsity
1)  na rdzeniach tensorowych
2)  TP32 Tensor Float
WordPress Appliance - Powered by TurnKey Linux