Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fakt, že všechny velké AI hlasové režimy jsou poháněny hloupými modely, natož podlézavými hloupými modely, které jsou navrženy tak, aby měly disfluenci, jež předstírají lidský chat ("ehm"), podceňuje hodnotu hlasu při správě agentů.
"Vážný hlasový režim" pro práci by byl velmi užitečný
Existují lepší modely: hlasy AI jsou základem médií už téměř celé století. A je důvod, proč počítač ze Star Treku nezachichotal, nepovzdechl si a neřekl "ehm" a neřekl vám, jak jste byli skvělí uprostřed úkolu s vysokými sázkami.
Je také pozoruhodně obtížné vytvořit tento chytrý hlasový režim s aktuálními API. V podstatě musíte přepisovat hlas do chytrého modelu pomocí jednoho nástroje a pak použít TTS pomocí jiného, který nemá žádné z těch přechodů a přerušitelnosti, které plně multimodální hlas umožňuje.
162
Top
Hodnocení
Oblíbené
