Dia - 현실적인 대화를 생성하는 오픈 웨이트 TTS 모델
------------------------------
- Dia는 텍스트 대사를 기반으로 *고품질 대화 음성을 생성하는 1.6B 파라미터 TTS 모델* 로, 오디오 프롬프트를 통해 감정·톤 조절이 가능함
- Nari Labs에서 개발했으며, "Nari"는 순수 한국어로 "*백합* "을 의미함
- [S1], [S2]로 화자를 지정하고 (laughs)
, (coughs)
등의 *비언어적 표현도 생성 가능* …
------------------------------
https://news.hada.io/topic?id=20467&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
If you have a fediverse account, you can quote this note from your own instance. Search https://sns.lemondouble.com/notes/a6vgny42wy on your instance and quote it. (Note that quoting is not supported in Mastodon.)