Конфигурации и цены
Конфигурации для этой GPU уточняйте напрямую.
Связаться с намиПолные технические характеристики и AI/ML бенчмарки
NVIDIA L40S в базе GPUТехнические характеристики
- Архитектура
- Ada Lovelace
- VRAM
- 48 ГБ
- CUDA-ядра
- 18176
- FP32 TFLOPS
- 91.6
- FP16 TFLOPS
- 183.2
- Пропускная способность памяти
- 864 ГБ/с
- TDP
- 350 Вт
- NVLink
- Нет
Подходит для
NVIDIA L40S на архитектуре Ada Lovelace — профессиональная серверная GPU, ориентированная на ML inference и fine-tuning. 48 ГБ ECC GDDR6 с нативной поддержкой FP8 позволяют вдвое увеличить пропускную способность по сравнению с FP16, делая L40S лидером по соотношению цена/производительность для inference средних моделей (до 34B в FP8). В отличие от потребительских карт, L40S обеспечивает стабильную работу под 24/7 нагрузкой и поддерживает ECC-память, что критично для production-развёртывания.
Сколько моделей поместится
Приблизительная оценка: params × precision × overhead < VRAM
Llama 3.1 8B (fp16)
~16 ГБ, помещается с запасом
Llama 3.1 34B (fp8)
~41 ГБ, помещается — нативный FP8 L40S ускоряет вывод
Llama 3.1 70B (fp16)
не помещается (~168 ГБ) — нужен A100/H100 80 ГБ
Mistral 7B (fp16)
~17 ГБ, помещается с запасом
Stable Diffusion XL
~10 ГБ, отличная производительность
Whisper large-v3
~3 ГБ
Сравнение с похожими GPU
| Характеристика | NVIDIA L40S | NVIDIA L40 | NVIDIA RTX 4090 | NVIDIA A100 |
|---|---|---|---|---|
| VRAM | 48 ГБ | 48 ГБ | 24 ГБ | 80 ГБ |
| от ₽/час | — | — | 68.79 ₽ | — |
| Подходит для | LLM inference, Обучение LLM | LLM inference, Генерация изображений | LLM inference, Генерация изображений | Обучение LLM, Fine-tuning |
| Страница | Текущая | Открыть → | Открыть → | Открыть → |
Часто задаваемые вопросы
Готовы начать?
Почасовая тарификация. Без подписки. Запуск за 30 секунд.