A melhor parte deste lançamento é que há um modelo de streaming de 0,5B e um modelo TTS de 7B a caminho também 🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26/08, 03:39
A Microsoft acaba de lançar o VibeVoice - modelo de Texto para Fala SoTA 1.5B - Licença MIT 🔥 > Pode gerar até 90 minutos de áudio > Suporta geração simultânea de > 4 falantes > Streaming e modelo maior de 7B a caminho > Capaz de síntese cruzada de línguas e canto Adoro a expressividade e o controle emocional do modelo! Parabéns à Microsoft 🤗
26,74K