La parte migliore di questo rilascio è che ci sono in arrivo anche un modello di streaming da 0,5B e un modello TTS da 7B 🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 ago, 03:39
Microsoft ha appena rilasciato VibeVoice - modello di sintesi vocale SoTA 1.5B - Licenza MIT 🔥 > Può generare fino a 90 minuti di audio > Supporta la generazione simultanea di > 4 relatori > Streaming e modello più grande da 7B in arrivo > Capace di sintesi cross-linguale e cantata Adoro l'espressività e il controllo delle emozioni nel modello! Complimenti a Microsoft 🤗
26,72K