Речь / ASR Apache-2.0

Kokoro

Transformer · hexgrad · 2024

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 2 ГБ Максимальное Для продакшена
INT8 1 ГБ Хорошее

Совместимые GPU

GPU VRAM Поддерживает
24 ГБ FP16, INT8 Арендовать
24 ГБ FP16, INT8 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
hexgrad
Год выпуска
2024
Архитектура
Transformer
Лицензия
Apache-2.0
Формат вывода
WAV
Realtime factor
50×

Применение

Text-to-speech Fast TTS Edge TTS

Kokoro — сверхкомпактная TTS-модель (82M параметров) с высоким качеством синтеза речи. Apache-2.0 лицензия. Работает на CPU и минимальном GPU. Идеальна для встроенного TTS в приложениях.