Скидка 5% при первом запуске GPU по промокоду Активировать скидку

Аренда NVIDIA RTX 4090 — от 69.05 ₽/час

24 ГБ VRAM · Ada Lovelace

Оплата картой РФ
Договор и документы
Запуск за 30 секунд
Поддержка на русском

Конфигурации и цены

Доступно прямо сейчас: 8 конфигураций
Конфигурация ₽/час ₽/мес Доступность Действие
1× NVIDIA RTX 4090 / 16 vCPU / 24 ГБ VRAM 69.05 ₽ 50 407 ₽ Доступно Выбрать
1× NVIDIA RTX 4090 / 19 vCPU / 48 ГБ VRAM 101.53 ₽ 74 117 ₽ Доступно Выбрать
2× NVIDIA RTX 4090 / 42 vCPU / 24 ГБ VRAM 140.3 ₽ 102 419 ₽ Доступно Выбрать
2× NVIDIA RTX 4090 / 36 vCPU / 22 ГБ VRAM 145.27 ₽ 106 047 ₽ Доступно Выбрать
2× NVIDIA RTX 4090 / 32 vCPU / 48 ГБ VRAM 147.91 ₽ 107 974 ₽ Доступно Выбрать
4× NVIDIA RTX 4090 / 128 vCPU / 24 ГБ VRAM 284.99 ₽ 208 043 ₽ Доступно Выбрать
4× NVIDIA RTX 4090 / 64 vCPU / 48 ГБ VRAM 474.88 ₽ 346 662 ₽ Доступно Выбрать
8× NVIDIA RTX 4090 / 0 vCPU / 24 ГБ VRAM 1090.2 ₽ 795 846 ₽ Доступно Выбрать

* Цены в рублях с НДС. Почасовая тарификация без минимального срока аренды. Счёт и закрывающие документы по запросу.

Полные технические характеристики и AI/ML бенчмарки

NVIDIA RTX 4090 в базе GPU

Технические характеристики

Архитектура
Ada Lovelace
VRAM
24 ГБ
CUDA-ядра
16384
FP32 TFLOPS
82.6
FP16 TFLOPS
165.2
Пропускная способность памяти
1008 ГБ/с
TDP
450 Вт
NVLink
Нет

Подходит для

NVIDIA RTX 4090 — флагманская потребительская GPU поколения Ada Lovelace. Благодаря высокой пропускной способности памяти и мощному тензорному ядру четвёртого поколения карта хорошо подходит для задач inference, генерации изображений и рендеринга.

Сколько моделей поместится

Приблизительная оценка: params × precision × overhead < VRAM

Llama 3.1 8B (fp16)

~16 ГБ, помещается с запасом

13B-class model (fp16)

~31 ГБ — не помещается на 24 ГБ; используйте fp8 (~16 ГБ) или 4-bit (~8 ГБ)

Llama 3.1 70B (fp16)

не помещается (~168 ГБ) — нужен A100/H100 80 ГБ

Mistral 7B (fp16)

~17 ГБ, помещается с запасом

Stable Diffusion XL

~10 ГБ, рекомендуется

Whisper large-v3

~3 ГБ

Готовые приложения на этой видеокарте

Один клик из браузера — окружение и модель уже на месте, не нужно настраивать.

Хостинг ComfyUI с Flux на облачном GPU

от 30 ₽/час

Готовое окружение ComfyUI с предустановленным Flux.1. Запуск за один клик, оплата по часам, без локальной видеокарты.

Запустить

Свой чат-бот с open-source LLM на облачном GPU

от 30 ₽/час

Знакомый веб-чат поверх выбранной модели — Llama 3.1, Qwen2.5 или Mistral — на вашей собственной видеокарте. ChatGPT-подобный интерфейс, никаких данных в OpenAI.

Запустить

SDXL в ComfyUI — фотореализм на GPU

от 45 ₽/час

RealVisXL V5.0 в ComfyUI за один клик: портреты и фотореал без локальной установки.

Запустить

ИИ-агент для кода на своём GPU

от 80 ₽/час

Qwen2.5-Coder-32B через vLLM на облачной видеокарте — OpenAI-совместимый эндпоинт для CloudCompute Coder, Cline, Continue, Aider и любого совместимого клиента.

Запустить

Синтез речи и клонирование голоса на облачном GPU

от 25 ₽/час

Запустите открытые модели F5-TTS или XTTS-v2 на арендованной видеокарте — веб-интерфейс для синтеза речи и клонирования голоса по образцу 10–15 секунд. Веса и аудио остаются на вашем инстансе.

Запустить

Синхронизация губ MuseTalk на облачном GPU

от 25 ₽/час

Аудио-управляемая синхронизация губ за один клик: загрузите фото или видео с лицом и WAV-аудио — получите talking-head mp4. Работает на GPU от 8 ГБ VRAM.

Запустить

Сравнение с похожими GPU

Характеристика NVIDIA RTX 4090 NVIDIA RTX 4080 Super NVIDIA H100 SXM NVIDIA A100
VRAM 24 ГБ 16 ГБ 80 ГБ 80 ГБ
от ₽/час 69.05 ₽
Подходит для LLM inference, Генерация изображений LLM inference (7–13B), Stable Diffusion XL Обучение LLM, Fine-tuning больших моделей Обучение LLM, Fine-tuning
Страница Текущая Открыть → Открыть → Открыть →

Часто задаваемые вопросы

Готовы начать?

Почасовая тарификация. Без подписки. Запуск за 30 секунд.