Два месяца назад я восхищался синтезированным голосом от elevenlabs. Это время прошло. Зацените как передает эмоции модель DIA 😳.
Попробовать можно тут (только английский)
Может:
• Генерировать смех, вздохи и живые эмоции
• Копировать любой голос
• Работать практически в реальном времени на больших GPU
• Полностью открыта под лицензией Apache 2.0
Примеры со сравнением тут: https://yummy-fir-7a4.notion.site/dia
Код и доки на GitHub: https://github.com/nari-labs/dia
Модель на Hugging Face: https://huggingface.co/nari-labs/Dia-1.6B
Оригинал в Telegram: https://t.me/segagridchin/43
