DIA и новый уровень синтезированной речи

Два месяца назад я восхищался синтезированным голосом от elevenlabs. Это время прошло. Зацените как передает эмоции модель DIA 😳.

Попробовать можно тут (только английский)

Может:
• Генерировать смех, вздохи и живые эмоции
• Копировать любой голос
• Работать практически в реальном времени на больших GPU
• Полностью открыта под лицензией Apache 2.0

Примеры со сравнением тут: https://yummy-fir-7a4.notion.site/dia

Код и доки на GitHub: https://github.com/nari-labs/dia
Модель на Hugging Face: https://huggingface.co/nari-labs/Dia-1.6B

Оригинал в Telegram: https://t.me/segagridchin/43