База данных

GPU для AI/ML

Технические характеристики, бенчмарки tokens/sec и сравнение производительности 36 GPU — от RTX до H100 и B200.

Арендовать GPU

B200

Blackwell · 2024

180

ГБ VRAM

4,500

FP16 TFLOPS

8000

ГБ/с BW

Обучение Инференс HPC
NVLink MIG ECC
На платформе

RTX 5090

Blackwell · 2025

32

ГБ VRAM

838

FP16 TFLOPS

1792

ГБ/с BW

Инференс Image gen Обучение
На платформе

RTX 5080

Blackwell · 2025

16

ГБ VRAM

551

FP16 TFLOPS

960

ГБ/с BW

Инференс Image gen
На платформе

RTX 5070 Ti

Blackwell · 2025

16

ГБ VRAM

356

FP16 TFLOPS

896

ГБ/с BW

Инференс Image gen
На платформе

RTX 5070

Blackwell · 2025

12

ГБ VRAM

244

FP16 TFLOPS

672

ГБ/с BW

Инференс Image gen
На платформе

RTX 5060 Ti

Blackwell · 2025

16

ГБ VRAM

160

FP16 TFLOPS

448

ГБ/с BW

Инференс Image gen
На платформе

H200 SXM

Hopper · 2024

141

ГБ VRAM

1,979

FP16 TFLOPS

4800

ГБ/с BW

Llama 3.1 8B · FP16 3,200 tok/s
Обучение Инференс HPC
NVLink MIG ECC
На платформе

H100 SXM

Hopper · 2022

80

ГБ VRAM

1,979

FP16 TFLOPS

3350

ГБ/с BW

Llama 3.1 8B · FP16 2,900 tok/s
Обучение Инференс HPC
NVLink MIG ECC
На платформе

H100 NVL

Hopper · 2023

94

ГБ VRAM

1,671

FP16 TFLOPS

3936

ГБ/с BW

Обучение Инференс
NVLink MIG ECC

H100 PCIe

Hopper · 2022

80

ГБ VRAM

1,513

FP16 TFLOPS

2000

ГБ/с BW

Llama 3.1 8B · FP16 2,100 tok/s
Обучение Инференс
MIG ECC

A100 SXM 80GB

Ampere · 2020

80

ГБ VRAM

312

FP16 TFLOPS

2000

ГБ/с BW

Llama 3.1 8B · FP16 1,100 tok/s
Обучение Инференс HPC
NVLink MIG ECC

A100 PCIe 80GB

Ampere · 2021

80

ГБ VRAM

312

FP16 TFLOPS

1935

ГБ/с BW

Llama 3.1 8B · FP16 1,050 tok/s
Обучение Инференс
MIG ECC

A100 PCIe 40GB

Ampere · 2020

40

ГБ VRAM

312

FP16 TFLOPS

1555

ГБ/с BW

Llama 3.1 8B · FP16 900 tok/s
Обучение Инференс
MIG ECC

A30

Ampere · 2021

24

ГБ VRAM

165

FP16 TFLOPS

933

ГБ/с BW

Инференс HPC
NVLink MIG ECC

L40S

Ada Lovelace · 2023

48

ГБ VRAM

183

FP16 TFLOPS

864

ГБ/с BW

Llama 3.1 8B · FP16 900 tok/s
Инференс Image gen Рендеринг
ECC
На платформе

L40

Ada Lovelace · 2022

48

ГБ VRAM

181

FP16 TFLOPS

864

ГБ/с BW

Инференс Image gen Рендеринг
ECC

L4

Ada Lovelace · 2023

24

ГБ VRAM

121

FP16 TFLOPS

300

ГБ/с BW

Инференс Image gen
ECC
На платформе

RTX 6000 Ada

Ada Lovelace · 2022

48

ГБ VRAM

182

FP16 TFLOPS

960

ГБ/с BW

Инференс Image gen Рендеринг
ECC
На платформе

RTX 5880 Ada

Ada Lovelace · 2024

48

ГБ VRAM

177

FP16 TFLOPS

960

ГБ/с BW

Инференс Рендеринг
ECC

RTX 4000 Ada

Ada Lovelace · 2023

20

ГБ VRAM

54

FP16 TFLOPS

432

ГБ/с BW

Инференс Image gen
ECC
На платформе

RTX PRO 6000 WS

Blackwell · 2025

96

ГБ VRAM

248

FP16 TFLOPS

1792

ГБ/с BW

Обучение Инференс Рендеринг
NVLink ECC
На платформе

RTX PRO 6000 S

Blackwell · 2025

96

ГБ VRAM

248

FP16 TFLOPS

1792

ГБ/с BW

Обучение Инференс
ECC
На платформе

RTX PRO 5000

Blackwell · 2025

32

ГБ VRAM

120

FP16 TFLOPS

576

ГБ/с BW

Инференс Рендеринг
ECC
На платформе

RTX PRO 4000

Blackwell · 2025

16

ГБ VRAM

67

FP16 TFLOPS

288

ГБ/с BW

Инференс
ECC
На платформе

RTX 4090

Ada Lovelace · 2022

24

ГБ VRAM

165

FP16 TFLOPS

1008

ГБ/с BW

Llama 3.1 8B · FP16 680 tok/s
Инференс Image gen Рендеринг
На платформе

RTX 4080 Super

Ada Lovelace · 2024

16

ГБ VRAM

104

FP16 TFLOPS

736

ГБ/с BW

Инференс Image gen

RTX 4080

Ada Lovelace · 2022

16

ГБ VRAM

98

FP16 TFLOPS

717

ГБ/с BW

Инференс Image gen
На платформе

RTX 4070 Ti Super

Ada Lovelace · 2024

16

ГБ VRAM

88

FP16 TFLOPS

672

ГБ/с BW

Инференс Image gen
На платформе

RTX 4070 Ti

Ada Lovelace · 2023

12

ГБ VRAM

80

FP16 TFLOPS

504

ГБ/с BW

Инференс Image gen
На платформе

RTX 4070 Super

Ada Lovelace · 2024

12

ГБ VRAM

71

FP16 TFLOPS

504

ГБ/с BW

Инференс Image gen
На платформе

RTX 4070

Ada Lovelace · 2023

12

ГБ VRAM

58

FP16 TFLOPS

504

ГБ/с BW

Инференс Image gen
На платформе

RTX A6000

Ampere · 2020

48

ГБ VRAM

77

FP16 TFLOPS

768

ГБ/с BW

Llama 3.1 8B · FP16 560 tok/s
Инференс Обучение Рендеринг
NVLink ECC

RTX A4000

Ampere · 2021

16

ГБ VRAM

39

FP16 TFLOPS

448

ГБ/с BW

Инференс Рендеринг
NVLink ECC
На платформе

RTX 3090

Ampere · 2020

24

ГБ VRAM

71

FP16 TFLOPS

936

ГБ/с BW

Llama 3.1 8B · FP16 400 tok/s
Инференс Обучение Image gen
NVLink

RTX 3090 Ti

Ampere · 2022

24

ГБ VRAM

80

FP16 TFLOPS

1008

ГБ/с BW

Инференс Обучение Image gen
NVLink

RTX 3080 Ti

Ampere · 2021

12

ГБ VRAM

68

FP16 TFLOPS

912

ГБ/с BW

Инференс Image gen

Только AI/ML

Никаких игровых бенчмарков. Только то, что важно: TFLOPS, VRAM bandwidth, tokens/sec.

Реальные бенчмарки

Данные по токенам в секунду для Llama 3.1 8B и 70B — то, что разработчики ищут в первую очередь.

Связь с ценами

Каждая GPU ссылается на цены аренды — сравнивайте характеристики и стоимость рядом.

Нашли нужную GPU?

Арендуйте почасово — запуск за 30 секунд, оплата в рублях.

Смотреть цены