Речь / ASR MIT

Faster-Whisper Large v3

Transformer · SYSTRAN · 2023

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 6 ГБ Максимальное Для продакшена
INT8 3 ГБ Хорошее

Совместимые GPU

GPU VRAM Поддерживает
24 ГБ FP16, INT8 Арендовать
24 ГБ FP16, INT8 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
SYSTRAN
Год выпуска
2023
Архитектура
Transformer
Лицензия
MIT
Формат вывода
text
Realtime factor
60×

Применение

High-throughput transcription Real-time ASR Batch processing

Faster-Whisper Large v3 — оптимизированная реализация Whisper Large v3 на CTranslate2. До 4× быстрее оригинала при меньшем VRAM. Идеальна для batch-транскрипции и high-throughput сервисов.