Лучшая часть этого релиза в том, что также ожидается модель стриминга на 0,5B и модель TTS на 7B 🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 авг., 03:39
Microsoft только что выпустила VibeVoice - 1.5B SoTA модель текст в речь - лицензия MIT 🔥 > Она может генерировать до 90 минут аудио > Поддерживает одновременную генерацию более 4-х голосов > В ближайшее время будет доступна потоковая передача и большая модель 7B > Способна на кросс-языковую и певческую синтезу Мне нравится выразительность и контроль эмоций в модели! Молодцы, Microsoft 🤗
26,72K