Речь / ASR MIT

Whisper Small

Transformer · OpenAI · 2022

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 2 ГБ Максимальное Для продакшена
INT8 1 ГБ Хорошее

Совместимые GPU

GPU VRAM Поддерживает
24 ГБ FP16, INT8 Арендовать
24 ГБ FP16, INT8 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
OpenAI
Год выпуска
2022
Архитектура
Transformer
Лицензия
MIT
Формат вывода
text
Realtime factor
100×

Применение

Speech recognition Real-time transcription Edge ASR

Whisper Small — компактная ASR-модель для задач с ограниченными ресурсами. Подходит для real-time транскрипции и edge-деплоя. Работает с минимальным VRAM.