Image Generation

FLUX

Семейство диффузионных моделей Black Forest Labs на Rectified Flow с лучшим качеством на 2024 год.

Что такое FLUX

FLUX — серия диффузионных моделей от Black Forest Labs (основатели Stable Diffusion), выпущенная в 2024 году. Использует архитектуру Multimodal Diffusion Transformer (MMDiT) с Rectified Flow вместо стандартного U-Net + DDPM, что обеспечивает:

  • Значительно лучшую детализацию
  • Корректный рендеринг текста прямо на изображении
  • Точное следование сложным промптам
  • Более реалистичную анатомию и перспективу

По качеству FLUX.1 dev/pro превосходит SDXL и SD3 и конкурирует с Midjourney v6.

Варианты FLUX.1

Вариант Лицензия VRAM Шаги Качество
FLUX.1 schnell Apache 2.0 12 ГБ 4 Хорошее
FLUX.1 dev Non-commercial 24 ГБ 20 Отличное
FLUX.1 pro API-only Лучшее

schnell — 4-шаговая distilled-версия, быстрая и бесплатная. dev — guidance-distilled, несколько медленнее, качество выше. pro — только через API Black Forest Labs.

Запуск в ComfyUI

# Скачать модель FLUX.1 schnell (quantized, 12 ГБ)
huggingface-cli download city96/FLUX.1-schnell-gguf \
  flux1-schnell-Q8_0.gguf --local-dir models/unet/

# Для FLUX нужны также
# - CLIP-L и T5-XXL энкодеры (или совместимые)
# - VAE (ae.safetensors)
# Скачать с: huggingface.co/black-forest-labs/FLUX.1-schnell

FLUX через Diffusers

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-schnell",
    torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()  # для GPU с 12 ГБ

image = pipe(
    "A futuristic city at sunset, photorealistic, 8k",
    guidance_scale=0.0,   # schnell не использует guidance
    num_inference_steps=4,
    height=1024, width=1024,
).images[0]
image.save("flux_output.png")

Связанные термины

  • Stable Diffusion — предшественник
  • SDXL — предыдущее поколение
  • ComfyUI — основной UI для FLUX
  • sampler — для FLUX специфические сэмплеры

Готовы запустить GPU-задачу?

Запустить GPU-сервер