Image Generation

LoRA (image gen)

Лёгкие адаптеры для Stable Diffusion, добавляющие стиль, персонажа или концепцию без переобучения.

Что такое LoRA в генерации изображений

LoRA (Low-Rank Adaptation) в контексте генерации изображений — небольшой (~50–200 МБ) адаптер, встраиваемый в веса UNet (и иногда CLIP) Stable Diffusion. В отличие от LLM-LoRA, image LoRA обучается на наборе изображений и кодирует визуальный стиль, конкретного персонажа, объект, концепцию или позу.

LoRA накладываются поверх базовой модели: можно комбинировать несколько LoRA с разными весами.

Типы LoRA для изображений

Тип Обучающие данные Применение
Style LoRA 20–50 изображений одного стиля Аниме, акварель, конкретный художник
Character LoRA 10–30 фото персонажа Конкретное лицо, аниме-персонаж
Object LoRA 10–30 фото предмета Логотип, продукт, дизайн
Concept LoRA 20–50 изображений концепции Освещение, угол, эффект

Использование в ComfyUI / A1111

ComfyUI: нода Load LoRA + Apply LoRA, вес (strength) регулируется.

A1111: в промпте вставить <lora:имя_файла:0.8> (вес 0–1.5).

# Скачать LoRA с CivitAI (popular resource)
# Разместить в models/Lora/my_lora.safetensors

# A1111 промпт с LoRA
"beautiful portrait, <lora:face_enhancement:0.7>, <lora:anime_style:0.5>"

Обучение собственной LoRA

# kohya_ss (популярный инструмент обучения LoRA)
git clone https://github.com/kohya-ss/sd-scripts
pip install -r requirements.txt

python train_network.py \
  --pretrained_model_name_or_path="stabilityai/stable-diffusion-xl-base-1.0" \
  --dataset_config=dataset_config.toml \
  --output_dir="./lora_output" \
  --network_module=networks.lora \
  --network_dim=64 \          # LoRA rank
  --network_alpha=32 \
  --learning_rate=1e-4 \
  --max_train_steps=1000

Связанные термины

  • Stable Diffusion — базовая модель
  • UNet — где встраивается LoRA
  • ComfyUI — node-based применение LoRA
  • AUTOMATIC1111 — синтаксис <lora:name:weight>

Готовы запустить GPU-задачу?

Запустить GPU-сервер