La mejor parte de este lanzamiento es que también hay un modelo de streaming de 0.5B y un modelo de TTS de 7B en camino 🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 ago, 03:39
Microsoft acaba de lanzar VibeVoice - modelo de texto a voz SoTA 1.5B - Licencia MIT 🔥 > Puede generar hasta 90 minutos de audio > Soporta la generación simultánea de más de 4 hablantes > Streaming y un modelo más grande de 7B en camino > Capaz de síntesis cruzada de idiomas y canto ¡Me encanta la expresividad y el control emocional en el modelo! ¡Felicitaciones a Microsoft 🤗
26,74K