GPU для AI/ML

Инференс Image gen Обучение

RTX 5090

Blackwell · 2025

ГБ VRAM

838

FP16 TFLOPS

1792

ГБ/с BW

RTX 5080

Blackwell · 2025

ГБ VRAM

551

FP16 TFLOPS

960

ГБ/с BW

RTX 5070 Ti

Blackwell · 2025

ГБ VRAM

356

FP16 TFLOPS

896

ГБ/с BW

RTX 5070

Blackwell · 2025

ГБ VRAM

244

FP16 TFLOPS

672

ГБ/с BW

RTX 5060 Ti

Blackwell · 2025

ГБ VRAM

160

FP16 TFLOPS

448

ГБ/с BW

Llama 3.1 8B · FP163,200 tok/s

H200 SXM

Hopper · 2024

141

ГБ VRAM

1,979

FP16 TFLOPS

4800

ГБ/с BW

Llama 3.1 8B · FP162,900 tok/s

H100 SXM

Hopper · 2022

ГБ VRAM

1,979

FP16 TFLOPS

3350

ГБ/с BW

H100 NVL

Hopper · 2023

ГБ VRAM

1,671

FP16 TFLOPS

3936

ГБ/с BW

Llama 3.1 8B · FP162,100 tok/s

H100 PCIe

Hopper · 2022

ГБ VRAM

1,513

FP16 TFLOPS

2000

ГБ/с BW

Llama 3.1 8B · FP161,100 tok/s

MIG ECC

A100 SXM 80GB

Ampere · 2020

ГБ VRAM

312

FP16 TFLOPS

2000

ГБ/с BW

Llama 3.1 8B · FP161,050 tok/s

A100 PCIe 80GB

Ampere · 2021

ГБ VRAM

312

FP16 TFLOPS

1935

ГБ/с BW

Llama 3.1 8B · FP16900 tok/s

MIG ECC

A100 PCIe 40GB

Ampere · 2020

ГБ VRAM

312

FP16 TFLOPS

1555

ГБ/с BW

MIG ECC

A30

Ampere · 2021

ГБ VRAM

165

FP16 TFLOPS

933

ГБ/с BW

Инференс HPC

Llama 3.1 8B · FP16900 tok/s

L40S

Ada Lovelace · 2023

ГБ VRAM

183

FP16 TFLOPS

864

ГБ/с BW

L40

Ada Lovelace · 2022

ГБ VRAM

181

FP16 TFLOPS

864

ГБ/с BW

L4

Ada Lovelace · 2023

ГБ VRAM

121

FP16 TFLOPS

300

ГБ/с BW

RTX 6000 Ada

Ada Lovelace · 2022

ГБ VRAM

182

FP16 TFLOPS

960

ГБ/с BW

RTX 5880 Ada

Ada Lovelace · 2024

ГБ VRAM

177

FP16 TFLOPS

960

ГБ/с BW

Инференс Рендеринг

RTX 4000 Ada

Ada Lovelace · 2023

ГБ VRAM

FP16 TFLOPS

432

ГБ/с BW

Обучение Инференс Рендеринг

RTX PRO 6000 WS

Blackwell · 2025

ГБ VRAM

248

FP16 TFLOPS

1792

ГБ/с BW

NVLink ECC

RTX PRO 6000 S

Blackwell · 2025

ГБ VRAM

248

FP16 TFLOPS

1792

ГБ/с BW

RTX PRO 5000

Blackwell · 2025

ГБ VRAM

120

FP16 TFLOPS

576

ГБ/с BW

Инференс Рендеринг

RTX PRO 4000

Blackwell · 2025

ГБ VRAM

FP16 TFLOPS

288

ГБ/с BW

Инференс

Llama 3.1 8B · FP16680 tok/s

RTX 4090

Ada Lovelace · 2022

ГБ VRAM

165

FP16 TFLOPS

1008

ГБ/с BW

RTX 4080 Super

Ada Lovelace · 2024

ГБ VRAM

104

FP16 TFLOPS

736

ГБ/с BW

RTX 4080

Ada Lovelace · 2022

ГБ VRAM

FP16 TFLOPS

717

ГБ/с BW

RTX 4070 Ti Super

Ada Lovelace · 2024

ГБ VRAM

FP16 TFLOPS

672

ГБ/с BW

RTX 4070 Ti

Ada Lovelace · 2023

ГБ VRAM

FP16 TFLOPS

504

ГБ/с BW

RTX 4070 Super

Ada Lovelace · 2024

ГБ VRAM

FP16 TFLOPS

504

ГБ/с BW

RTX 4070

Ada Lovelace · 2023

ГБ VRAM

FP16 TFLOPS

504

ГБ/с BW

Llama 3.1 8B · FP16560 tok/s

RTX A6000

Ampere · 2020

ГБ VRAM

FP16 TFLOPS

768

ГБ/с BW

Инференс Обучение Рендеринг

NVLink ECC

RTX A4000

Ampere · 2021

ГБ VRAM

FP16 TFLOPS

448

ГБ/с BW

Инференс Рендеринг

NVLink ECC

Llama 3.1 8B · FP16400 tok/s

RTX 3090

Ampere · 2020

ГБ VRAM

FP16 TFLOPS

936

ГБ/с BW

Инференс Обучение Image gen

NVLink

RTX 3090 Ti

Ampere · 2022

ГБ VRAM

FP16 TFLOPS

1008

ГБ/с BW

Инференс Обучение Image gen

NVLink

RTX 3080 Ti

Ampere · 2021

ГБ VRAM

FP16 TFLOPS

912

ГБ/с BW