Câteva note despre lansarea gpt-realtime înlocuiește STT→LLM→TTS înlănțuit cu un singur model de vorbire în / ieșire (latență mai mică, nuanță mai bogată) - uriaș imo 🔥 Pe benchmark-uri (vs GPT4o-realtime): > scoruri 82.8% vs 65.6% pe BigBench (raționament) > 30,5% față de 20,6% pe MultiChallenge Audio (instrucțiuni următoare) > 66,5% față de 49,7% pe ComplexFuncBench (apelare de funcții) Câștigurile includ prozodie îmbunătățită, controlul tonului, acuratețe non-verbală și alfanumerică și comutare multilingvă API în timp real acum GA cu telefon SIP, intrare imagine, integrare instrument MCP toate acestea cu un API cu 20% mai mic - destul de dulce (deși cred că este încă puțin prea scump)
10,95K