Речь / ASR MIT

Whisper Medium

Transformer · OpenAI · 2022

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 5 ГБ Максимальное Для продакшена
INT8 3 ГБ Хорошее
INT4/Q4 2 ГБ Приемлемое Для экспериментов

Совместимые GPU

GPU VRAM Поддерживает
24 ГБ FP16, INT8, INT4 Арендовать
24 ГБ FP16, INT8, INT4 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
OpenAI
Год выпуска
2022
Архитектура
Transformer
Лицензия
MIT
Формат вывода
text
Realtime factor
60×

Применение

Speech recognition Transcription Multilingual ASR

Whisper Medium — среднеразмерная ASR-модель OpenAI. Хороший баланс качества и скорости. Поддерживает 99 языков, подходит для production-транскрипции с умеренными требованиями к точности.