Речь / ASR Apache-2.0

Parler TTS

Transformer · Hugging Face · 2024

VRAM по точности

Точность VRAM Качество Рекомендация
FP16 6 ГБ Максимальное Для продакшена
INT8 3 ГБ Хорошее

Совместимые GPU

GPU VRAM Поддерживает
24 ГБ FP16, INT8 Арендовать
24 ГБ FP16, INT8 Арендовать

Рекомендуемые фреймворки

Характеристики модели

Технические параметры

Разработчик
Hugging Face
Год выпуска
2024
Архитектура
Transformer
Лицензия
Apache-2.0
Формат вывода
WAV
Realtime factor

Применение

Text-to-speech Controlled voice synthesis Podcast generation

Parler TTS — открытая TTS-модель Hugging Face с управлением стилем голоса через текстовые описания. Apache-2.0 лицензия. Позволяет задавать тембр, темп и эмоциональный окрас через prompt.