Генерация изображений Restricted

Stable Diffusion 3.5 Large

Diffusion · Stability AI · 2024

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 16 ГБ Максимальное Для продакшена
INT8 8 ГБ Хорошее
INT4/Q4 8 ГБ Приемлемое Для экспериментов

Совместимые GPU

GPU VRAM Поддерживает
24 ГБ FP16, INT8, INT4 Арендовать
80 ГБ FP16, INT8, INT4 Арендовать
80 ГБ FP16, INT8, INT4 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
Stability AI
Год выпуска
2024
Архитектура
Diffusion
Лицензия
Restricted
Разрешение
1024x1024
Формат вывода
PNG

Применение

Image generation Prompt adherence Typography in images High-quality synthesis

Stable Diffusion 3.5 Large — модель нового поколения от Stability AI с MMDiT-подобной архитектурой: сильнее держит сложные промпты, лучше справляется с мелким текстом и «логичной» композицией, чем классический UNet SDXL. Это уже не тот класс инструментов, что SD 1.5: выше планка качества, но выше и требования к VRAM/настройке pipeline. Лицензия ограниченная — проверьте условия для вашего сценария.

Запуск на cloudcompute.ru

Шаг 1 — Арендуйте GPU

Ориентир по памяти — от ~16 ГБ VRAM в fp16 для Large; надёжнее RTX 4090 или A100. Перейдите в каталог GPU.

Шаг 2 — Запустите ComfyUI

docker run --gpus all -p 8188:8188 \
  -v comfyui-data:/root \
  ghcr.io/ai-dock/comfyui:latest

Откройте http://localhost:8188. Установите компоненты SD 3.5 (и требуемые веса) согласно актуальной документации выбранных нод; при ручной установке следите за путями models для diffusers-формата.

Шаг 3 — Сгенерируйте изображение

Пример через Diffusers (версии пакета должны поддерживать SD3):

import torch
from diffusers import StableDiffusion3Pipeline

pipe = StableDiffusion3Pipeline.from_pretrained(
    "stabilityai/stable-diffusion-3.5-large",
    torch_dtype=torch.float16,
)
pipe = pipe.to("cuda")
image = pipe(
    "A poster with the words 'Open Source' in clean sans-serif, print quality",
    num_inference_steps=28,
    guidance_scale=7.0,
).images[0]
image.save("output.png")

Оптимизация

  • Снижайте разрешение на отладке графа; поднимайте его только для финального рендера.
  • Используйте offload/tiling для VAE и смешанную точность, если карта упирается в память.