Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Det faktum att alla stora AI-röstmoden drivs av dumma modeller, för att inte tala om smickrande dumma modeller som är designade för att ha disfluenser som fejkar en mänsklig chatt ("eh"), underskattar värdet av röst i hantering av agenter.
Ett "seriöst röstläge" för arbete vore mycket användbart
Det finns bättre modeller där ute: AI-röster har varit en stapelvara i media i större delen av ett sekel. Och det finns en anledning till att datorn från Star Trek inte fnissade och suckade och sa "eh" och berättade hur bra du var mitt i en höginsatsuppgift.
Det är också anmärkningsvärt svårt att skapa detta smarta röstläge med de nuvarande API:erna. Du behöver i princip transkribera röst till en smart modell med ett verktyg och sedan använda TTS med ett annat, som saknar det fram och tillbaka och avbrott som full multimodal röst kan göra.
166
Topp
Rankning
Favoriter
