VRAM по точности

Точность	VRAM	Качество	Рекомендация
FP16	8 ГБ	Максимальное	Для продакшена
INT8	4 ГБ	Хорошее
INT4/Q4	4 ГБ	Приемлемое	Для экспериментов

Совместимые GPU

GPU

VRAM

Поддерживает

Рек. NVIDIA RTX 4090

24 ГБ

FP16, INT8, INT4

Арендовать

NVIDIA RTX 3090

24 ГБ

FP16, INT8, INT4

Арендовать

NVIDIA A100

80 ГБ

FP16, INT8, INT4

Арендовать

Характеристики модели

Технические параметры

Разработчик: Stability AI
Год выпуска: 2023
Архитектура: Diffusion
Лицензия: Apache-2.0
Разрешение: 1024x1024
Формат вывода: PNG

Применение

Image generation Image-to-image Inpainting Fine-tuning

Stable Diffusion XL — эволюция линейки SD с нативным 1024×1024, двухстадийной схемой (base + refiner) и заметно более сильной семантикой промпта, чем у SD 1.5. Это де-факто стандарт для кастомных чекпоинтов и LoRA в «полуторашном» сегменте: огромная экосистема UI, скриптов и обучающих рецептов. Для полного pipeline с refiner полезен запас VRAM; одна только base-модель обычно укладывается скромнее.

Запуск на cloudcompute.ru

Шаг 1 — Арендуйте GPU

Для комфортной работы с SDXL ориентируйтесь на от ~8 ГБ VRAM для base и больше — если подключаете refiner и high-res fix; хороший старт — RTX 3090 или RTX 4090. Перейдите в каталог GPU.

Шаг 2 — Запустите ComfyUI

docker run --gpus all -p 8188:8188 \
  -v comfyui-data:/root \
  ghcr.io/ai-dock/comfyui:latest

Откройте http://localhost:8188. Поместите stable-diffusion-xl-base-1.0 и при необходимости refiner в ожидаемые подпапки models (checkpoints / diffusers — в зависимости от нод).

Шаг 3 — Сгенерируйте изображение

В ComfyUI соберите классический SDXL-граф; в Diffusers для text-to-image:

import torch
from diffusers import StableDiffusionXLPipeline

pipe = StableDiffusionXLPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    torch_dtype=torch.float16,
    variant="fp16",
    use_safetensors=True,
)
pipe = pipe.to("cuda")
image = pipe("Ultra detailed portrait, 85mm lens, natural light").images[0]
image.save("output.png")

Оптимизация

Включайте VAE tiling/slicing при пиковом потреблении памяти и используйте enable_attention_slicing() при необходимости.
Разделяйте роли: base для композиции, refiner — для микродеталей; не всегда оба этапа нужны в прототипировании.

Stable Diffusion XL

VRAM по точности

Совместимые GPU

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Применение

Запуск на cloudcompute.ru

Шаг 1 — Арендуйте GPU

Шаг 2 — Запустите ComfyUI

Шаг 3 — Сгенерируйте изображение

Оптимизация