GPU Hardware

NVIDIA RTX 4090

Потребительский флагман NVIDIA с 24 ГБ GDDR6X, применяемый в fine-tuning и локальном инференсе.

Что такое NVIDIA RTX 4090

RTX 4090 — потребительский флагман NVIDIA на архитектуре Ada Lovelace (2022). Формально предназначен для игр и профессиональной визуализации, но благодаря 24 ГБ GDDR6X широко применяется в ML: fine-tuning небольших моделей, локальный инференс, разработка и эксперименты.

Технические характеристики

Параметр Значение
VRAM 24 ГБ GDDR6X
Пропускная способность памяти 1008 ГБ/с
CUDA Cores 16384
Tensor Cores (4th gen) 512
FP16 TFLOPS ~330
TDP 450 Вт
NVLink Нет
ECC память Нет (нет аппаратной коррекции ошибок)

Для каких ML-задач подходит

RTX 4090 оптимален:

  • Инференс моделей 7B–13B в BF16 — 80–120 токенов/с
  • Fine-tuning с QLoRA моделей до 34B (с INT4-квантизацией базы)
  • Локальная разработка и эксперименты
  • Генерация изображений (Stable Diffusion, FLUX) — отличная производительность
  • Запуск ComfyUI, AUTOMATIC1111

Ограничения:

  • 24 ГБ — модели 30B+ в BF16 не помещаются
  • Нет NVLink — мультикарточные конфигурации работают только через PCIe
  • Нет ECC — не рекомендуется для длительных mission-critical вычислений

RTX 4090 vs A100 40GB

RTX 4090 A100 40GB
VRAM 24 ГБ 40 ГБ
Пропускная способность 1008 ГБ/с 1555 ГБ/с
FP16 производительность ~330 TFLOPS 624 TFLOPS
ECC память Нет Есть
NVLink Нет Есть
Цена/час (ориентир) ~₽50–80 ~₽150–200

Для задач в пределах 24 ГБ RTX 4090 — экономически выгодный выбор. Для 40B+ и production — A100.

Связанные термины

  • NVIDIA A100 — серверная альтернатива с большей VRAM
  • NVIDIA L40S — серверная альтернатива с 48 ГБ
  • QLoRA — метод fine-tuning, оптимизированный для ограниченной VRAM
  • GDDR6 — тип памяти RTX 4090
  • Stable Diffusion — популярное применение RTX 4090

Готовы запустить GPU-задачу?

Запустить GPU-сервер