Kandinsky 5.0 Video Pro
19B параметров · Flow Matching · Sber AI · 2025
VRAM по точности
| Точность | VRAM | Качество | Рекомендация |
|---|---|---|---|
| FP16 | 48 ГБ | Максимальное | Для продакшена |
| INT8 | 28 ГБ | Хорошее |
Совместимые GPU
| GPU | VRAM | Поддерживает | |
|---|---|---|---|
|
Рек.
NVIDIA A100
|
80 ГБ | FP16, INT8 | Арендовать |
| 80 ГБ | FP16, INT8 | Арендовать | |
| 141 ГБ | FP16, INT8 | Арендовать |
Рекомендуемые фреймворки
Характеристики модели
Технические параметры
- Разработчик
- Sber AI
- Год выпуска
- 2025
- Параметры
- 19B
- Архитектура
- Flow Matching
- Лицензия
- MIT
- Разрешение
- 1080p
- Формат вывода
- MP4
Применение
Kandinsky 5.0 Video Pro — топовая модель видеогенерации от Sber AI, 19B параметров. Выпущена 20 ноября 2025 года. В декабре 2025 заняла #1 место среди open-source text-to-video моделей на LMArena, обойдя Wan-2.2, HunyuanVideo и LTX Video 2. По качеству сравнима с Google Veo 3.
Генерирует HD-видео до 10 секунд при 24fps, поддерживает text-to-video и image-to-video. Лицензия MIT — свободное коммерческое использование. Требует серверных GPU с 48+ ГБ VRAM.
Запуск на cloudcompute.ru
Шаг 1 — Арендуйте GPU
Video Pro требует от 48 ГБ VRAM. Минимум — A100 80GB. Для комфортной работы и батч-генерации — H100 или H200.
Шаг 2 — Генерация видео
import torch
from diffusers import Kandinsky5T2VPipeline
pipe = Kandinsky5T2VPipeline.from_pretrained(
"kandinskylab/Kandinsky-5.0-T2V-Pro-sft-5s-Diffusers",
torch_dtype=torch.bfloat16,
)
pipe.enable_model_cpu_offload()
video = pipe(
"Документальная съёмка: волны Балтийского моря разбиваются о гранитную набережную, "
"закат, золотой свет на воде, кинематографическое качество"
).frames
Шаг 3 — Image-to-video
from PIL import Image
photo = Image.open("product_photo.jpg")
video = pipe(
"Камера облетает объект, мягкое студийное освещение",
image=photo,
).frames
Бенчмарки
Рейтинг open-source text-to-video моделей по данным LMArena на декабрь 2025:
| Модель | Позиция (дек. 2025) | Категория |
|---|---|---|
| Kandinsky 5.0 Video Pro | #1 open-source | Open-source |
| Wan-2.2 | #2 | Open-source |
| HunyuanVideo | #3 | Open-source |
| LTX Video 2 | #4 | Open-source |
| Google Veo 3 | #1 overall | Closed-source |
Video Pro — единственная российская модель, конкурирующая с западными лидерами по качеству видеогенерации.
Когда использовать Video Pro vs Video Lite
| Параметр | Video Lite | Video Pro |
|---|---|---|
| Параметры | 2B | 19B |
| VRAM | 12–24 ГБ | 48+ ГБ |
| Качество | Хорошее | Лучшее в классе |
| GPU | RTX 4090 | A100 / H100 |
| Цена за ролик | ~₽5–15 (RTX 4090) | ~₽30–80 (H100) |
| Когда выбирать | Прототипы, массовая генерация, бюджетные GPU | Финальный контент, маркетинг, production |
Camera Control LoRAs
Sber AI выпустил LoRA-адаптеры для управления камерой в Video Pro: панорамирование, зум, вращение. Обучены отдельно от Video Lite LoRAs. Подробнее — в руководстве по LoRA.
Ограничения
- Максимальная длительность — 10 секунд
- Требует 48+ ГБ VRAM — только серверные GPU
- Медленнее Video Lite из-за размера модели (19B vs 2B)
- Нет audio-генерации
Связанные модели
- Kandinsky 5.0 Video Lite — компактная версия (2B, consumer GPU)
- Kandinsky 5.0 Image Lite — генерация изображений
- Kandinsky 3.1 — предыдущее поколение