video MIT

Kandinsky 5.0 Video Pro

19B параметров · Flow Matching · Sber AI · 2025

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 48 ГБ Максимальное Для продакшена
INT8 28 ГБ Хорошее

Совместимые GPU

GPU VRAM Поддерживает
80 ГБ FP16, INT8 Арендовать
80 ГБ FP16, INT8 Арендовать
141 ГБ FP16, INT8 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
Sber AI
Год выпуска
2025
Параметры
19B
Архитектура
Flow Matching
Лицензия
MIT
Разрешение
1080p
Формат вывода
MP4

Применение

Text-to-video Image-to-video High-quality video generation Russian-language prompts Commercial use (MIT license)

Kandinsky 5.0 Video Pro — топовая модель видеогенерации от Sber AI, 19B параметров. Выпущена 20 ноября 2025 года. В декабре 2025 заняла #1 место среди open-source text-to-video моделей на LMArena, обойдя Wan-2.2, HunyuanVideo и LTX Video 2. По качеству сравнима с Google Veo 3.

Генерирует HD-видео до 10 секунд при 24fps, поддерживает text-to-video и image-to-video. Лицензия MIT — свободное коммерческое использование. Требует серверных GPU с 48+ ГБ VRAM.

Запуск на cloudcompute.ru

Шаг 1 — Арендуйте GPU

Video Pro требует от 48 ГБ VRAM. Минимум — A100 80GB. Для комфортной работы и батч-генерации — H100 или H200.

Шаг 2 — Генерация видео

import torch
from diffusers import Kandinsky5T2VPipeline

pipe = Kandinsky5T2VPipeline.from_pretrained(
    "kandinskylab/Kandinsky-5.0-T2V-Pro-sft-5s-Diffusers",
    torch_dtype=torch.bfloat16,
)
pipe.enable_model_cpu_offload()

video = pipe(
    "Документальная съёмка: волны Балтийского моря разбиваются о гранитную набережную, "
    "закат, золотой свет на воде, кинематографическое качество"
).frames

Шаг 3 — Image-to-video

from PIL import Image

photo = Image.open("product_photo.jpg")
video = pipe(
    "Камера облетает объект, мягкое студийное освещение",
    image=photo,
).frames

Бенчмарки

Рейтинг open-source text-to-video моделей по данным LMArena на декабрь 2025:

Модель Позиция (дек. 2025) Категория
Kandinsky 5.0 Video Pro #1 open-source Open-source
Wan-2.2 #2 Open-source
HunyuanVideo #3 Open-source
LTX Video 2 #4 Open-source
Google Veo 3 #1 overall Closed-source

Video Pro — единственная российская модель, конкурирующая с западными лидерами по качеству видеогенерации.

Когда использовать Video Pro vs Video Lite

Параметр Video Lite Video Pro
Параметры 2B 19B
VRAM 12–24 ГБ 48+ ГБ
Качество Хорошее Лучшее в классе
GPU RTX 4090 A100 / H100
Цена за ролик ~₽5–15 (RTX 4090) ~₽30–80 (H100)
Когда выбирать Прототипы, массовая генерация, бюджетные GPU Финальный контент, маркетинг, production

Camera Control LoRAs

Sber AI выпустил LoRA-адаптеры для управления камерой в Video Pro: панорамирование, зум, вращение. Обучены отдельно от Video Lite LoRAs. Подробнее — в руководстве по LoRA.

Ограничения

  • Максимальная длительность — 10 секунд
  • Требует 48+ ГБ VRAM — только серверные GPU
  • Медленнее Video Lite из-за размера модели (19B vs 2B)
  • Нет audio-генерации

Связанные модели