Точность

VRAM

Качество

Рекомендация

FP16

16 ГБ

Максимальное

Для продакшена

INT8

8 ГБ

Хорошее

INT4/Q4

8 ГБ

Приемлемое

Для экспериментов

GPU

VRAM

Поддерживает

Рек. NVIDIA RTX 4090

24 ГБ

FP16, INT8, INT4

Арендовать

NVIDIA A100

80 ГБ

FP16, INT8, INT4

Арендовать

NVIDIA H100 SXM

80 ГБ

FP16, INT8, INT4

Арендовать

Характеристики модели

Технические параметры

Разработчик: Stability AI
Год выпуска: 2024
Архитектура: Diffusion
Лицензия: Restricted
Разрешение: 1024x1024
Формат вывода: PNG

Применение

Image generation Prompt adherence Typography in images High-quality synthesis

Stable Diffusion 3.5 Large — модель нового поколения от Stability AI с MMDiT-подобной архитектурой: сильнее держит сложные промпты, лучше справляется с мелким текстом и «логичной» композицией, чем классический UNet SDXL. Это уже не тот класс инструментов, что SD 1.5: выше планка качества, но выше и требования к VRAM/настройке pipeline. Лицензия ограниченная — проверьте условия для вашего сценария.

Запуск на cloudcompute.ru

Шаг 1 — Арендуйте GPU

Ориентир по памяти — от ~16 ГБ VRAM в fp16 для Large; надёжнее RTX 4090 или A100. Перейдите в каталог GPU.

Шаг 2 — Запустите ComfyUI

docker run --gpus all -p 8188:8188 \
  -v comfyui-data:/root \
  ghcr.io/ai-dock/comfyui:latest

Откройте http://localhost:8188. Установите компоненты SD 3.5 (и требуемые веса) согласно актуальной документации выбранных нод; при ручной установке следите за путями models для diffusers-формата.

Шаг 3 — Сгенерируйте изображение

Пример через Diffusers (версии пакета должны поддерживать SD3):

import torch
from diffusers import StableDiffusion3Pipeline

pipe = StableDiffusion3Pipeline.from_pretrained(
    "stabilityai/stable-diffusion-3.5-large",
    torch_dtype=torch.float16,
)
pipe = pipe.to("cuda")
image = pipe(
    "A poster with the words 'Open Source' in clean sans-serif, print quality",
    num_inference_steps=28,
    guidance_scale=7.0,
).images[0]
image.save("output.png")

Оптимизация

Снижайте разрешение на отладке графа; поднимайте его только для финального рендера.
Используйте offload/tiling для VAE и смешанную точность, если карта упирается в память.

Stable Diffusion 3.5 Large

VRAM по точности

Совместимые GPU

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Применение

Запуск на cloudcompute.ru

Шаг 1 — Арендуйте GPU

Шаг 2 — Запустите ComfyUI

Шаг 3 — Сгенерируйте изображение

Оптимизация