A Microsoft acaba de lançar o VibeVoice - 1.5B SoTA Text to Speech model - MIT Licensed 🔥 > Pode gerar até 90 minutos de áudio > Suporta geração simultânea de > 4 alto-falantes > Streaming e modelo 7B maior a caminho > Capaz de síntese multilíngue e cantada Adoro a expressividade e o controle de emoções no modelo! Parabéns à Microsoft 🤗
124,78K