Porównanie danych technicznych i wydajności kart NVIDIA

RTX 6000 Ada

RTX A6000

RTX A5500

RTX A5000

RTX A4500

RTX 4000 SFF Ada

RTX A4000

RTX A2000

L40

A40

A10

A16

H100

A100

A30

Quadro
RTX 8000

Quadro
RTX 8000 Passive

Quadro
RTX 6000

Quadro
RTX 6000 Passive

Quadro
RTX 5000

Quadro
RTX 4000

V100S

Przeznaczenie

Wirtualizacja / Visual Computing

CAD 3D / wizualizacja

Wirtualizacja / Visual Computing

AI, wideo, grafika

Wirtualizacja / Visual Computing

AI Inferencing

HPC / AI

HPC / AI / Wirtualizacja

CAD 3D / wizualizacja

Data Center

CAD 3D / wizualizacja

Data Center

CAD 3D / wizualizacja

HPC / AI

Przeznaczenie

GPU

Ada Lovelace AD102

Amper GA102

Ada Lovelace AD104

Amper GA104

Amper GA106

Ada Lovelace AD102

Ada Lovelace AD104

Ampere GA102

Ampere GA107 x4

Ampere GA107

Hopper GH100

Ampere GA100

Turing TU102

Turing TU104

Turing TU

Volta GV100

Turing TU104

GPU

Liczba rdzeni CUDA

18176

10752

10240

8192

7168

6144

3328

18176

10752

9216

1280 x4

1280

14592

6912 (Gen 3)

3804
(Gen 3)

4608

3072

2304

5120

2560

Liczba rdzeni CUDA

Liczba rdzeni Tensor

568 (Gen 4)

336 (Gen 3)

320 (Gen 3)

256 (Gen 3)

224 (Gen 3)

192 (Gen 4)

192 (Gen 3)

104 (Gen 3)

568 (Gen 4)

240

336

288

40 x4

456
(Gen 4)

432

224

576

384

288

640

320

Liczba rdzeni Tensor

Liczba rdzeni RTX

142 (Gen 3)

84 (Gen 2)

80 (Gen 2)

64 (Gen 2)

56 (Gen 2)

48 (Gen 3)

48 (Gen 2)

26 (Gen 2)

142 (Gen 3)

84 (Gen 2)

72 (Gen 2)

10 x4
(Gen 2)

10 (Gen 2)

–

Liczba rdzeni RTX

Pamięć

48 GB
GDDR6
384-bit

24 GB
GDDR6 384-bit

20 GB
GDDR6 320-bit

20 GB
GDDR6 160-bit

16 GB
GDDR6 256-bit

6 / 12 GB
GDDR6 192-bit

48 GB
GDDR6
384-bit

24 GB
GDDR6
192-bit

48 GB
GDDR6 384-bit

24 GB
DDR6

16 GB x4
DDR6

16 GB
DDR6

80 GB
HBM2e
5120-bit

80 GB
HBM2

24 GB
HBM2

48 GB
GDDR6

24 GB
GDDR6

16 GB
GDDR6

8 GB
GDDR6

32 GB
HBM2

16 GB
GDDR6

Pamięć

ECC

Tak

–

Tak

ECC

Wydajność rdzeni RT
(GPU Boost Clock)

210,6 TFLOPS

75,6 TFLOPS

66,6 TFLOPS

54,2 TFLOPS

46,2 TFLOPS

44,3 TFLOPS

37,4 TFLOPS

15,6 TFLOPS

209
TFLOPS

73,1 TFLOPS

TBD

–

84 Tera RTX-Ops

80 Tera RTX-Ops

84 Tera RTX-Ops

80 Tera RTX-Ops

62 Tera RTX-Ops

43 Tera RTX-Ops

–

TBD

Wydajność rdzeni RT
(GPU Boost Clock)

Wydajność FP64
(GPU Boost Clock)

–

26 / 51¹⁾ TFLOPS

9,7 / 19,5¹⁾ TFLOPS

5,2 / 10,3¹⁾ TFLOPS

–

8,2 TFLOPS

–

Wydajność FP64
(GPU Boost Clock)

Wydajność FP32
(GPU Boost Clock)

92,1
TFLOPS

38,7 TFLOPS

34,1 TFLOPS

27,8 TFLOPS

23,7 TFLOPS

19,2 TFLOPS

19,17 TFLOPS

8,0 TFLOPS

90,5
TFLOPS

30,3 TFLOPS

37,4
TFLOPS

31,2 / 62,5¹⁾ / 125^1*)TFLOPS

4,5 x4 / 9¹⁾ x4 / 18^1*) x4 TFLOPS

4,5 / 9¹⁾ / 18^1*) TFLOPS

51 / 378²⁾ / 756^2*) TFLOPS

19,5 / 156²⁾ / 312^2*) TFLOPS

10,3 / 82¹⁾ / 165^1*) TFLOPS

16,3 TFLOPS

14,9 TFLOPS

16,3 TFLOPS

14,9 TFLOPS

11,2 TFLOPS

7,1 TFLOPS

16,4 TFLOPS

8,1 TFLOPS

Wydajność FP32
(GPU Boost Clock)

Wydajność FP16
(GPU Boost Clock)

92,1
TFLOPS

38,7 TFLOPS

TBD

27,8 TFLOPS

TBD

19,2 TFLOPS

19,17 TFLOPS

TBD

^181/362*)
TFLOPS

242^*) TFLOPS

38,7 TFLOPS

125¹⁾/ 250^1*)TFLOPS

17,9¹⁾ x4 / 35,9^1*) x4 TFLOPS

17,9¹⁾ / 35,9^1*) TFLOPS

756,5¹⁾ / 1513^1*) TFLOPS

78 / 624^*) TFLOPS

165¹⁾/ 330^1*)TFLOPS

32,6 TFLOPS

29,9 TFLOPS

32,6 TFLOPS

29,9 TFLOPS

22,3 TFLOPS

14,2 TFLOPS

31,4 TFLOPS

16 TFLOPS

Wydajność FP16
(GPU Boost Clock)

Wydajność INT8

TBD

^362/724*) TOPS

485^*) TOPS

^{299,3/598,6*)} TOPS

250¹⁾/ 500^1*)TOPS

35,9¹⁾ x4/ 71,8^1*) x4 TOPS

35,9¹⁾ / 71,8^1*) TOPS

1513 / 3026¹⁾ TOPS

624 / 1248^*) TOPS

330¹⁾/ 661^1*)TOPS

261 TOPS

238,9 TOPS

261 TOPS

238,9 TOPS

178,4 TOPS

28,5 TOPS

–

130 TOPS

Wydajność INT8

Wydajność INT4

TBD

^724/1448*) TOPS

^{598,7/1197,4*)} TOPS

500¹⁾ / 1000^1*) TOPS

TBD

72¹⁾ / 144^1*) TOPS

TBD

1248 / 2496^*) TOPS

661¹⁾ / 1321^1*)TOPS

522 TOPS

477,8 TOPS

522 TOPS

477,8 TOPS

356,8 TOPS

57 TOPS

–

260 TOPS

Wydajność INT4

Chłodzenie

aktywne

pasywne

aktywne

pasywne

aktywne

pasywne

aktywne

pasywne

Chłodzenie

NVLink

–

112,5 GB/s

–

112,5 GB/s

–

600 GB/s

200 GB/s

100 GB/s

50 GB/s

–

NVLink

Obsługa wyświetlaczy

4x DP 1.4

–

3x DP 1.4

–

4x DP 1.4
+ VLink

–

4x DP 1.4
+ VLink

–

4x DP 1.4
+ VLink

3x DP 1.4
+ VLink

–

Obsługa wyświetlaczy

Szyna PCIe

4.0 x16

4.0 x8

5.0 x16

4.0 x16

3.0 x16

3.0 x16 x8

Szyna PCIe

Max. pobór mocy

300 W

230 W

200 W

70 W

140 W

70 W

300 W

72 W

300 W

150 W

250 W

40 – 60 W

300 – 350 W

300 W

165 W

295 W

250 W

295 W

250 W

265 W

160 W

250 W

70 W

Max. pobór mocy

*) z funkcją Sparsity
1) na rdzeniach tensorowych
2) TP32 Tensor Float