GPU Hardware
NVIDIA RTX 4090
Потребительский флагман NVIDIA с 24 ГБ GDDR6X, применяемый в fine-tuning и локальном инференсе.
Что такое NVIDIA RTX 4090
RTX 4090 — потребительский флагман NVIDIA на архитектуре Ada Lovelace (2022). Формально предназначен для игр и профессиональной визуализации, но благодаря 24 ГБ GDDR6X широко применяется в ML: fine-tuning небольших моделей, локальный инференс, разработка и эксперименты.
Технические характеристики
| Параметр | Значение |
|---|---|
| VRAM | 24 ГБ GDDR6X |
| Пропускная способность памяти | 1008 ГБ/с |
| CUDA Cores | 16384 |
| Tensor Cores (4th gen) | 512 |
| FP16 TFLOPS | ~330 |
| TDP | 450 Вт |
| NVLink | Нет |
| ECC память | Нет (нет аппаратной коррекции ошибок) |
Для каких ML-задач подходит
RTX 4090 оптимален:
- Инференс моделей 7B–13B в BF16 — 80–120 токенов/с
- Fine-tuning с QLoRA моделей до 34B (с INT4-квантизацией базы)
- Локальная разработка и эксперименты
- Генерация изображений (Stable Diffusion, FLUX) — отличная производительность
- Запуск ComfyUI, AUTOMATIC1111
Ограничения:
- 24 ГБ — модели 30B+ в BF16 не помещаются
- Нет NVLink — мультикарточные конфигурации работают только через PCIe
- Нет ECC — не рекомендуется для длительных mission-critical вычислений
RTX 4090 vs A100 40GB
| RTX 4090 | A100 40GB | |
|---|---|---|
| VRAM | 24 ГБ | 40 ГБ |
| Пропускная способность | 1008 ГБ/с | 1555 ГБ/с |
| FP16 производительность | ~330 TFLOPS | 624 TFLOPS |
| ECC память | Нет | Есть |
| NVLink | Нет | Есть |
| Цена/час (ориентир) | ~₽50–80 | ~₽150–200 |
Для задач в пределах 24 ГБ RTX 4090 — экономически выгодный выбор. Для 40B+ и production — A100.
Связанные термины
- NVIDIA A100 — серверная альтернатива с большей VRAM
- NVIDIA L40S — серверная альтернатива с 48 ГБ
- QLoRA — метод fine-tuning, оптимизированный для ограниченной VRAM
- GDDR6 — тип памяти RTX 4090
- Stable Diffusion — популярное применение RTX 4090
Готовы запустить GPU-задачу?
Запустить GPU-сервер