Image Generation
FLUX
Семейство диффузионных моделей Black Forest Labs на Rectified Flow с лучшим качеством на 2024 год.
Что такое FLUX
FLUX — серия диффузионных моделей от Black Forest Labs (основатели Stable Diffusion), выпущенная в 2024 году. Использует архитектуру Multimodal Diffusion Transformer (MMDiT) с Rectified Flow вместо стандартного U-Net + DDPM, что обеспечивает:
- Значительно лучшую детализацию
- Корректный рендеринг текста прямо на изображении
- Точное следование сложным промптам
- Более реалистичную анатомию и перспективу
По качеству FLUX.1 dev/pro превосходит SDXL и SD3 и конкурирует с Midjourney v6.
Варианты FLUX.1
| Вариант | Лицензия | VRAM | Шаги | Качество |
|---|---|---|---|---|
| FLUX.1 schnell | Apache 2.0 | 12 ГБ | 4 | Хорошее |
| FLUX.1 dev | Non-commercial | 24 ГБ | 20 | Отличное |
| FLUX.1 pro | API-only | — | — | Лучшее |
schnell — 4-шаговая distilled-версия, быстрая и бесплатная. dev — guidance-distilled, несколько медленнее, качество выше. pro — только через API Black Forest Labs.
Запуск в ComfyUI
# Скачать модель FLUX.1 schnell (quantized, 12 ГБ)
huggingface-cli download city96/FLUX.1-schnell-gguf \
flux1-schnell-Q8_0.gguf --local-dir models/unet/
# Для FLUX нужны также
# - CLIP-L и T5-XXL энкодеры (или совместимые)
# - VAE (ae.safetensors)
# Скачать с: huggingface.co/black-forest-labs/FLUX.1-schnell
FLUX через Diffusers
import torch
from diffusers import FluxPipeline
pipe = FluxPipeline.from_pretrained(
"black-forest-labs/FLUX.1-schnell",
torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload() # для GPU с 12 ГБ
image = pipe(
"A futuristic city at sunset, photorealistic, 8k",
guidance_scale=0.0, # schnell не использует guidance
num_inference_steps=4,
height=1024, width=1024,
).images[0]
image.save("flux_output.png")
Связанные термины
- Stable Diffusion — предшественник
- SDXL — предыдущее поколение
- ComfyUI — основной UI для FLUX
- sampler — для FLUX специфические сэмплеры
Готовы запустить GPU-задачу?
Запустить GPU-сервер