Image Generation
upscaler
Нейросетевой инструмент для увеличения разрешения изображения с сохранением деталей.
Что такое upscaler
Upscaler — нейросеть для увеличения разрешения изображения (super-resolution). В отличие от бикубической интерполяции, нейросетевые апскейлеры восстанавливают и синтезируют детали при увеличении.
В контексте Stable Diffusion апскейлеры используются для:
- Увеличения 512×512 до 2048×2048 после генерации
- Финального «полирования» после SD hires.fix
- Улучшения деталей лиц и текстур
Популярные апскейлеры
| Апскейлер | Стиль | Кратность | Применение |
|---|---|---|---|
| 4xRealESRGAN | Реалистичный | 4× | Фотореализм |
| 4xAnime | Аниме | 4× | Аниме-стиль |
| ESRGAN | Универсальный | 4× | Общее использование |
| SwinIR | Универсальный | 2–4× | Высокое качество |
| LDSR | На основе SD | 4× | Медленный, высочайшее качество |
| Lanczos | Бикубическая | Любая | Без артефактов, без деталей |
Использование в A1111
Extras tab: загрузить изображение → Upscaler → Apply
Hires.fix: при генерации txt2img включить опцию Hires.fix для upscale + второй проход SD с низким denoising_strength (0.4–0.6):
- SD генерирует в 512×512
- Апскейлер увеличивает до 1024×1024
- SD делает img2img с strength=0.4 → улучшает детали
# Через Diffusers + RealESRGAN
from basicsr.archs.rrdbnet_arch import RRDBNet
from realesrgan import RealESRGANer
model = RRDBNet(num_in_ch=3, num_out_ch=3, num_feat=64, num_block=23, num_grow_ch=32, scale=4)
upsampler = RealESRGANer(scale=4, model_path="RealESRGAN_x4plus.pth", model=model)
output, _ = upsampler.enhance(np.array(pil_image), outscale=4)
Связанные термины
- Stable Diffusion — основная модель, дополняемая апскейлером
- img2img — второй шаг hires.fix
- AUTOMATIC1111 — Extras tab с апскейлерами
- ComfyUI — ноды Image Upscale
Готовы запустить GPU-задачу?
Запустить GPU-сервер