Генерация изображений Apache-2.0

Stable Diffusion XL

Diffusion · Stability AI · 2023

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 8 ГБ Максимальное Для продакшена
INT8 4 ГБ Хорошее
INT4/Q4 4 ГБ Приемлемое Для экспериментов

Совместимые GPU

GPU VRAM Поддерживает
24 ГБ FP16, INT8, INT4 Арендовать
24 ГБ FP16, INT8, INT4 Арендовать
80 ГБ FP16, INT8, INT4 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
Stability AI
Год выпуска
2023
Архитектура
Diffusion
Лицензия
Apache-2.0
Разрешение
1024x1024
Формат вывода
PNG

Применение

Image generation Image-to-image Inpainting Fine-tuning

Stable Diffusion XL — эволюция линейки SD с нативным 1024×1024, двухстадийной схемой (base + refiner) и заметно более сильной семантикой промпта, чем у SD 1.5. Это де-факто стандарт для кастомных чекпоинтов и LoRA в «полуторашном» сегменте: огромная экосистема UI, скриптов и обучающих рецептов. Для полного pipeline с refiner полезен запас VRAM; одна только base-модель обычно укладывается скромнее.

Запуск на cloudcompute.ru

Шаг 1 — Арендуйте GPU

Для комфортной работы с SDXL ориентируйтесь на от ~8 ГБ VRAM для base и больше — если подключаете refiner и high-res fix; хороший старт — RTX 3090 или RTX 4090. Перейдите в каталог GPU.

Шаг 2 — Запустите ComfyUI

docker run --gpus all -p 8188:8188 \
  -v comfyui-data:/root \
  ghcr.io/ai-dock/comfyui:latest

Откройте http://localhost:8188. Поместите stable-diffusion-xl-base-1.0 и при необходимости refiner в ожидаемые подпапки models (checkpoints / diffusers — в зависимости от нод).

Шаг 3 — Сгенерируйте изображение

В ComfyUI соберите классический SDXL-граф; в Diffusers для text-to-image:

import torch
from diffusers import StableDiffusionXLPipeline

pipe = StableDiffusionXLPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    torch_dtype=torch.float16,
    variant="fp16",
    use_safetensors=True,
)
pipe = pipe.to("cuda")
image = pipe("Ultra detailed portrait, 85mm lens, natural light").images[0]
image.save("output.png")

Оптимизация

  • Включайте VAE tiling/slicing при пиковом потреблении памяти и используйте enable_attention_slicing() при необходимости.
  • Разделяйте роли: base для композиции, refiner — для микродеталей; не всегда оба этапа нужны в прототипировании.