GPU Hardware

NVIDIA RTX 4090

Потребительский флагман NVIDIA с 24 ГБ GDDR6X, применяемый в fine-tuning и локальном инференсе.

Что такое NVIDIA RTX 4090

RTX 4090 — потребительский флагман NVIDIA на архитектуре Ada Lovelace (2022). Формально предназначен для игр и профессиональной визуализации, но благодаря 24 ГБ GDDR6X широко применяется в ML: fine-tuning небольших моделей, локальный инференс, разработка и эксперименты.

Технические характеристики

Параметр	Значение
VRAM	24 ГБ GDDR6X
Пропускная способность памяти	1008 ГБ/с
CUDA Cores	16384
Tensor Cores (4th gen)	512
FP16 TFLOPS	~330
TDP	450 Вт
NVLink	Нет
ECC память	Нет (нет аппаратной коррекции ошибок)

Для каких ML-задач подходит

RTX 4090 оптимален:

Инференс моделей 7B–13B в BF16 — 80–120 токенов/с
Fine-tuning с QLoRA моделей до 34B (с INT4-квантизацией базы)
Локальная разработка и эксперименты
Генерация изображений (Stable Diffusion, FLUX) — отличная производительность
Запуск ComfyUI, AUTOMATIC1111

Ограничения:

24 ГБ — модели 30B+ в BF16 не помещаются
Нет NVLink — мультикарточные конфигурации работают только через PCIe
Нет ECC — не рекомендуется для длительных mission-critical вычислений

RTX 4090 vs A100 40GB

	RTX 4090	A100 40GB
VRAM	24 ГБ	40 ГБ
Пропускная способность	1008 ГБ/с	1555 ГБ/с
FP16 производительность	~330 TFLOPS	624 TFLOPS
ECC память	Нет	Есть
NVLink	Нет	Есть
Цена/час (ориентир)	~₽50–80	~₽150–200

Для задач в пределах 24 ГБ RTX 4090 — экономически выгодный выбор. Для 40B+ и production — A100.

Связанные термины

NVIDIA A100 — серверная альтернатива с большей VRAM
NVIDIA L40S — серверная альтернатива с 48 ГБ
QLoRA — метод fine-tuning, оптимизированный для ограниченной VRAM
GDDR6 — тип памяти RTX 4090
Stable Diffusion — популярное применение RTX 4090

Готовы запустить GPU-задачу?

Запустить GPU-сервер