Microsoft tocmai a lansat VibeVoice - 1.5B SoTA Text to Speech model - Licențiat 🔥 MIT > Poate genera până la 90 de minute de audio > Suportă generarea simultană de > 4 difuzoare > Streaming și model 7B mai mare în viitor > Capabil de sinteză interlingviscă și cântată Iubesc expresivitatea și controlul emoțiilor pe model! Felicitări Microsoft 🤗
124,78K