Маркетплейс

Шаблоны GPU‑серверов

Готовые окружения для ML, инференса, генерации изображений и рендеринга. Выберите шаблон — запустите инстанс за минуту.

Запустить GPU-сервер

All-in-One App Studio

ComfyUI, SD Forge, Whisper, Unsloth, Wan2GP и другие инструменты — всё в одном инстансе с GPU-десктопом.

Всё в одном Linux от 24 ГБ VRAM
Ubuntu 24.04 CUDA 12.9 ComfyUI SD Forge ACE Step Voicebox Whisper Wan2GP AI Toolkit Unsloth Studio
Подробнее

vLLM

Высокопроизводительный сервер инференса LLM с OpenAI-совместимым API.

LLM-инференс Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 vLLM 0.19 Python 3.11
Подробнее

vLLM Omni

Мультимодальный инференс LLM — текст, изображения и другие модальности через единый API.

LLM-инференс Linux от 48 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 vLLM Omni 0.18 Ray Python 3.11
Подробнее

SGLang

Быстрый инференс LLM с FlashInfer — оптимизирован для structured generation и multi-turn.

LLM-инференс Linux от 24 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 SGLang 0.5 FlashInfer Python 3.11
Подробнее

Llama.cpp

Лёгкий инференс LLM на CPU и GPU — запускайте модели в формате GGUF без сложной настройки.

LLM-инференс Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 llama.cpp llama-server
Подробнее

Ollama

Запуск LLM одной командой — скачивайте и запускайте модели из библиотеки Ollama.

LLM-инференс Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.x Ollama 0.20 Python 3.11
Подробнее

Open WebUI + Ollama

Веб-интерфейс для общения с LLM — ChatGPT-подобный UI с локальными моделями через Ollama.

LLM-инференс Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.x Open WebUI 0.8 Ollama
Подробнее

Oobabooga Text Gen

Веб-интерфейс и API для генерации текста — загружайте любые модели с HuggingFace.

LLM-инференс Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.x text-generation-webui Python 3.11
Подробнее

HuggingFace TGI

Production-ready инференс от HuggingFace — оптимизирован для высокой пропускной способности.

LLM-инференс Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.x Text Generation Inference 2.0 Python 3.11
Подробнее

Axolotl

Fine-tuning LLM без боли — LoRA, QLoRA, full fine-tune с готовыми конфигами.

Обучение LLM Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.6+ Axolotl PyTorch DeepSpeed PEFT
Подробнее

Unsloth Studio

Ускоренный fine-tuning LLM — до 2× быстрее и 60% меньше VRAM по сравнению с HuggingFace.

Обучение LLM Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 Unsloth Studio 0.1 PyTorch Python 3.12
Подробнее

ComfyUI

Node-based интерфейс для Stable Diffusion — создавайте сложные пайплайны генерации изображений.

Генерация изображений Linux от 8 ГБ VRAM
Ubuntu 24.04 CUDA 12.9 ComfyUI 0.19 ComfyUI Manager Python 3.12
Подробнее

SD WebUI Forge

Оптимизированный WebUI для Stable Diffusion и FLUX — быстрее и экономичнее по VRAM.

Генерация изображений Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 SD WebUI Forge xformers Python 3.11
Подробнее

AUTOMATIC1111 Web UI

Классический веб-интерфейс для Stable Diffusion — простой старт для генерации изображений.

Генерация изображений Linux от 6 ГБ VRAM
Ubuntu 22.04 CUDA 12.x AUTOMATIC1111 Python 3.10
Подробнее

Fooocus

Генерация изображений в один клик — минимум настроек, максимум качества.

Генерация изображений Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.1 Fooocus Python 3.11
Подробнее

SwarmUI

Современный интерфейс для генерации изображений — поддержка SD, SDXL и FLUX.

Генерация изображений Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.1+ SwarmUI 0.9 ComfyUI backend
Подробнее

InvokeAI

Профессиональная студия генерации изображений — canvas, слои, ControlNet и node editor.

Генерация изображений Linux от 12 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 InvokeAI 6.12 Python 3.12
Подробнее

Kohya's GUI

Обучение LoRA для Stable Diffusion и FLUX — визуальный интерфейс с Tensorboard.

Обучение моделей Linux от 12 ГБ VRAM
Ubuntu 22.04 CUDA 12.6+ Kohya's GUI Tensorboard Python 3.11
Подробнее

Ostris AI Toolkit

Обучение диффузионных моделей — LoRA, full fine-tune с визуальным интерфейсом.

Обучение моделей Linux от 12 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 AI Toolkit Tensorboard Python 3.11
Подробнее

Flux Gym

Обучение LoRA для FLUX.1 — специализированный интерфейс с Tensorboard.

Обучение моделей Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 Flux Gym Tensorboard PyTorch 2.7
Подробнее

Wan2GP

Генерация видео из текста и изображений — Wan 2.2 с веб-интерфейсом.

Генерация видео Linux от 24 ГБ VRAM
Ubuntu 22.04 CUDA 12.6+ Wan2GP PyTorch Python 3.11
Подробнее

Open-Sora

Open-source генерация видео — text-to-video и image-to-video на мощных GPU.

Генерация видео Linux от 80 ГБ VRAM
Ubuntu 22.04 CUDA 12.4 Open-Sora 2.0 PyTorch 2.4
Подробнее

Whisper WebUI & API

Распознавание речи через OpenAI Whisper — веб-интерфейс и REST API.

Аудио и речь Linux от 12 ГБ VRAM
Ubuntu 22.04 CUDA 12.6+ Whisper faster-whisper Python 3.11
Подробнее

Voicebox TTS

Синтез речи с клонированием голоса — API и веб-интерфейс для text-to-speech.

Аудио и речь Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 Voicebox 0.3 Python 3.12
Подробнее

ACE Step 1.5

Генерация музыки из текстового описания — UI и API для создания аудиотреков.

Аудио и речь Linux от 12 ГБ VRAM
Ubuntu 22.04 CUDA 12.9 ACE Step 1.5 Python 3.11
Подробнее

Jupyter + PyTorch

Готовая среда для ML-экспериментов: PyTorch, Jupyter, CUDA — работайте сразу после запуска.

Jupyter / Исследования Linux от 8 ГБ VRAM
Ubuntu 24.04 CUDA 12.9 PyTorch 2.x Jupyter Lab Tensorboard
Подробнее

PyTorch NGC

Оптимизированный PyTorch от NVIDIA — DALI, NCCL, TensorRT, cuDNN в одном контейнере.

Jupyter / Исследования Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 13.0 PyTorch NGC 26.01 NCCL TensorRT DALI
Подробнее

TensorFlow CUDA

TensorFlow с GPU-ускорением — для обучения и инференса моделей.

Jupyter / Исследования Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.4 TensorFlow 2.19 Python 3.11
Подробнее

NVIDIA RAPIDS

GPU-ускоренный Data Science — cuDF, cuML, cuGraph для обработки данных на GPU.

Jupyter / Исследования Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.x RAPIDS cuDF cuML cuGraph Jupyter
Подробнее

Blender

GPU-рендеринг в Blender — Cycles на облачном GPU, быстрее в десятки раз.

3D / Стриминг Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.x Blender 4.x OptiX
Подробнее

Unreal Pixel Streaming

Стриминг Unreal Engine проектов через браузер — pixel streaming на облачном GPU.

3D / Стриминг Linux от 8 ГБ VRAM
Ubuntu 22.04 CUDA 12.1+ Unreal Engine 5.5 Pixel Streaming
Подробнее

CUDA Dev Environment

Чистое окружение с CUDA, компилятором и SSH — для разработки GPU-кода и экспериментов.

CUDA / Разработка Linux от 4 ГБ VRAM
Ubuntu 24.04 CUDA 12.9 cuDNN GCC Python 3.11 pip
Подробнее

Linux Desktop

Ubuntu Desktop в браузере — полноценный рабочий стол с GPU-ускорением.

Рабочий стол Linux от 4 ГБ VRAM
Ubuntu 24.04 CUDA 12.9 Selkies Apache Guacamole Syncthing
Подробнее

Pinokio Desktop

Десктоп с Pinokio — установка AI-приложений в один клик через визуальный менеджер.

Рабочий стол Linux от 8 ГБ VRAM
Ubuntu 24.04 CUDA 12.9 Pinokio 6.0 Selkies Desktop
Подробнее

Ubuntu Desktop (VM)

Полноценная виртуальная машина Ubuntu с KDE Plasma и GPU passthrough.

Рабочий стол Linux от 4 ГБ VRAM
Ubuntu 24.04 KDE Plasma GPU Passthrough Selkies
Подробнее

Ubuntu 22.04 VM

Виртуальная машина Ubuntu 22.04 — SSH-доступ с GPU passthrough.

Рабочий стол Linux от 4 ГБ VRAM
Ubuntu 22.04 GPU Passthrough SSH
Подробнее

Langflow + Ollama

Визуальный конструктор AI-агентов — drag-and-drop пайплайны с локальными LLM.

AI-агенты Linux от 16 ГБ VRAM
Ubuntu 22.04 CUDA 12.x Langflow Ollama
Подробнее

Hashcat CUDA

GPU-ускоренный аудит паролей — Hashcat на облачном GPU.

Безопасность Linux от 4 ГБ VRAM
Ubuntu 22.04 CUDA 12.8 Hashcat
Подробнее

Шаблоны сообщества

Популярные шаблоны от сообщества Vast.ai — тысячи готовых окружений.

Не нашли нужный шаблон?

Запустите собственный Docker-образ или свяжитесь с нами — подготовим шаблон под вашу задачу.