Image Generation

FLUX

Семейство диффузионных моделей Black Forest Labs на Rectified Flow с лучшим качеством на 2024 год.

Что такое FLUX

FLUX — серия диффузионных моделей от Black Forest Labs (основатели Stable Diffusion), выпущенная в 2024 году. Использует архитектуру Multimodal Diffusion Transformer (MMDiT) с Rectified Flow вместо стандартного U-Net + DDPM, что обеспечивает:

Значительно лучшую детализацию
Корректный рендеринг текста прямо на изображении
Точное следование сложным промптам
Более реалистичную анатомию и перспективу

По качеству FLUX.1 dev/pro превосходит SDXL и SD3 и конкурирует с Midjourney v6.

Варианты FLUX.1

Вариант	Лицензия	VRAM	Шаги	Качество
FLUX.1 schnell	Apache 2.0	12 ГБ	4	Хорошее
FLUX.1 dev	Non-commercial	24 ГБ	20	Отличное
FLUX.1 pro	API-only	—	—	Лучшее

schnell — 4-шаговая distilled-версия, быстрая и бесплатная. dev — guidance-distilled, несколько медленнее, качество выше. pro — только через API Black Forest Labs.

Запуск в ComfyUI

# Скачать модель FLUX.1 schnell (quantized, 12 ГБ)
huggingface-cli download city96/FLUX.1-schnell-gguf \
  flux1-schnell-Q8_0.gguf --local-dir models/unet/

# Для FLUX нужны также
# - CLIP-L и T5-XXL энкодеры (или совместимые)
# - VAE (ae.safetensors)
# Скачать с: huggingface.co/black-forest-labs/FLUX.1-schnell

FLUX через Diffusers

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-schnell",
    torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()  # для GPU с 12 ГБ

image = pipe(
    "A futuristic city at sunset, photorealistic, 8k",
    guidance_scale=0.0,   # schnell не использует guidance
    num_inference_steps=4,
    height=1024, width=1024,
).images[0]
image.save("flux_output.png")

Связанные термины

Stable Diffusion — предшественник
SDXL — предыдущее поколение
Kandinsky — российская альтернатива от Sber AI (русский язык, видеогенерация)
ComfyUI — основной UI для FLUX
sampler — для FLUX специфические сэмплеры

Готовы запустить GPU-задачу?

Запустить GPU-сервер