Как быстро можно запустить NVIDIA RTX 4090?

Инстанс с NVIDIA RTX 4090 запускается за 30 секунд после оплаты. Вы получаете SSH-доступ и ссылку на Jupyter Notebook. Никаких заявок и ожидания — всё автоматически.

Какие способы оплаты доступны?

Принимаем банковские карты РФ (Visa, Mastercard, МИР). Для юридических лиц — оплата по счёту с договором и закрывающими документами (акт, счёт-фактура). НДС включён в стоимость.

Чем RTX 4090 отличается от A100?

RTX 4090 — потребительская карта с акцентом на высокую пропускную способность памяти и inference. A100 — профессиональная серверная GPU с поддержкой NVLink, большим объёмом VRAM (до 80 ГБ) и оптимизацией под обучение крупных моделей. Для задач inference и генерации изображений RTX 4090 часто оказывается выгоднее по соотношению цена/производительность.

Подходит ли RTX 4090 для обучения LLM?

Да, для моделей до 7–8B параметров в float16 (~16 ГБ). Модели 13B в fp16 требуют ~31 ГБ и не помещаются в 24 ГБ VRAM — для них используйте fp8 (~16 ГБ) или 4-bit квантизацию (~8 ГБ). Для обучения крупных моделей (30B+) рекомендуется A100 или H100 с NVLink.

Сколько моделей помещается в VRAM RTX 4090?

При 24 ГБ VRAM в RTX 4090 помещается: модель 7B в float16 (~14 ГБ), модель 13B в 8-bit квантизации (~13 ГБ) или несколько небольших моделей одновременно при батчевой обработке запросов.

Поддерживает ли RTX 4090 NVLink?

Нет. RTX 4090 не поддерживает NVLink. Если вам нужно объединить несколько GPU в единое адресное пространство VRAM, рассмотрите A100 или H100.

Аренда NVIDIA RTX 4090 — от 69.05 ₽/час

Name: Аренда NVIDIA RTX 4090
Brand: NVIDIA
Availability: InStock

24 ГБ VRAM · Ada Lovelace

Арендовать

Оплата картой РФ

Договор и документы

Запуск за 30 секунд

Поддержка на русском

Конфигурации и цены

Доступно прямо сейчас: 8 конфигураций

Конфигурация	₽/час	₽/мес	Доступность	Действие
1× NVIDIA RTX 4090 / 16 vCPU / 24 ГБ VRAM	69.05 ₽	50 407 ₽	Доступно	Выбрать
1× NVIDIA RTX 4090 / 19 vCPU / 48 ГБ VRAM	101.53 ₽	74 117 ₽	Доступно	Выбрать
2× NVIDIA RTX 4090 / 42 vCPU / 24 ГБ VRAM	140.3 ₽	102 419 ₽	Доступно	Выбрать
2× NVIDIA RTX 4090 / 36 vCPU / 22 ГБ VRAM	145.27 ₽	106 047 ₽	Доступно	Выбрать
2× NVIDIA RTX 4090 / 32 vCPU / 48 ГБ VRAM	147.91 ₽	107 974 ₽	Доступно	Выбрать
4× NVIDIA RTX 4090 / 128 vCPU / 24 ГБ VRAM	284.99 ₽	208 043 ₽	Доступно	Выбрать
4× NVIDIA RTX 4090 / 64 vCPU / 48 ГБ VRAM	474.88 ₽	346 662 ₽	Доступно	Выбрать
8× NVIDIA RTX 4090 / 0 vCPU / 24 ГБ VRAM	1090.2 ₽	795 846 ₽	Доступно	Выбрать

* Цены в рублях с НДС. Почасовая тарификация без минимального срока аренды. Счёт и закрывающие документы по запросу.

Смотреть конфигурации в каталоге →

Полные технические характеристики и AI/ML бенчмарки

NVIDIA RTX 4090 в базе GPU

Технические характеристики

Архитектура: Ada Lovelace
VRAM: 24 ГБ
CUDA-ядра: 16384
FP32 TFLOPS: 82.6
FP16 TFLOPS: 165.2
Пропускная способность памяти: 1008 ГБ/с
TDP: 450 Вт
NVLink: Нет

Подходит для

LLM inference Генерация изображений Stable Diffusion Computer Vision Рендеринг

NVIDIA RTX 4090 — флагманская потребительская GPU поколения Ada Lovelace. Благодаря высокой пропускной способности памяти и мощному тензорному ядру четвёртого поколения карта хорошо подходит для задач inference, генерации изображений и рендеринга.

Сколько моделей поместится

Приблизительная оценка: params × precision × overhead < VRAM

Llama 3.1 8B (fp16)

~16 ГБ, помещается с запасом

13B-class model (fp16)

~31 ГБ — не помещается на 24 ГБ; используйте fp8 (~16 ГБ) или 4-bit (~8 ГБ)

Llama 3.1 70B (fp16)

не помещается (~168 ГБ) — нужен A100/H100 80 ГБ

Mistral 7B (fp16)

~17 ГБ, помещается с запасом

Stable Diffusion XL

~10 ГБ, рекомендуется

Whisper large-v3

~3 ГБ

Готовые приложения на этой видеокарте

Один клик из браузера — окружение и модель уже на месте, не нужно настраивать.

Хостинг ComfyUI с Flux на облачном GPU

от 30 ₽/час

Готовое окружение ComfyUI с предустановленным Flux.1. Запуск за один клик, оплата по часам, без локальной видеокарты.

Запустить

Свой чат-бот с open-source LLM на облачном GPU

от 30 ₽/час

Знакомый веб-чат поверх выбранной модели — Llama 3.1, Qwen2.5 или Mistral — на вашей собственной видеокарте. ChatGPT-подобный интерфейс, никаких данных в OpenAI.

Запустить

SDXL в ComfyUI — фотореализм на GPU

от 45 ₽/час

RealVisXL V5.0 в ComfyUI за один клик: портреты и фотореал без локальной установки.

Запустить

ИИ-агент для кода на своём GPU

от 80 ₽/час

Qwen2.5-Coder-32B через vLLM на облачной видеокарте — OpenAI-совместимый эндпоинт для CloudCompute Coder, Cline, Continue, Aider и любого совместимого клиента.

Запустить

Синтез речи и клонирование голоса на облачном GPU

от 25 ₽/час

Запустите открытые модели F5-TTS или XTTS-v2 на арендованной видеокарте — веб-интерфейс для синтеза речи и клонирования голоса по образцу 10–15 секунд. Веса и аудио остаются на вашем инстансе.

Запустить

Синхронизация губ MuseTalk на облачном GPU

от 25 ₽/час

Аудио-управляемая синхронизация губ за один клик: загрузите фото или видео с лицом и WAV-аудио — получите talking-head mp4. Работает на GPU от 8 ГБ VRAM.

Запустить

Сравнение с похожими GPU

Характеристика	NVIDIA RTX 4090	NVIDIA RTX 4080 Super	NVIDIA H100 SXM	NVIDIA A100
VRAM	24 ГБ	16 ГБ	80 ГБ	80 ГБ
от ₽/час	69.05 ₽	—	—	—
Подходит для	LLM inference, Генерация изображений	LLM inference (7–13B), Stable Diffusion XL	Обучение LLM, Fine-tuning больших моделей	Обучение LLM, Fine-tuning
Страница	Текущая	Открыть →	Открыть →	Открыть →

Часто задаваемые вопросы

Готовы начать?

Почасовая тарификация. Без подписки. Запуск за 30 секунд.

Создать аккаунт