Het beste deel van deze release is dat er ook een 0,5B streaming- en een 7B TTS-model aankomt 🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 aug, 03:39
Microsoft heeft zojuist VibeVoice uitgebracht - 1,5B SoTA tekst-naar-spraakmodel - MIT-licentie 🔥 > Het kan tot 90 minuten audio genereren > Ondersteunt gelijktijdige generatie van > 4 sprekers > Streaming en groter 7B-model in aantocht > In staat tot cross-linguale en zangsynthetisatie Hou van de expressiviteit en de emotiecontrole van het model! Petje af voor Microsoft 🤗
26,74K