Algumas notas sobre o lançamento gpt-realtime que substitui STT→LLM→TTS encadeado por um único modelo de entrada / saída de fala (menor latência, nuance mais rica) - enorme imo 🔥 Em benchmarks (vs GPT4o-tempo real): > pontuações 82.8% vs 65.6% no BigBench (raciocínio) > 30.5% vs 20.6% no MultiChallenge Audio (instruções a seguir) > 66,5% vs 49,7% no ComplexFuncBench (chamada de função) Os ganhos incluem prosódia aprimorada, controle de tom, precisão não verbal e alfanumérica e comutação multilíngue API em tempo real agora GA com telefone SIP, entrada de imagem, integração de ferramenta MCP tudo isso com API 20% menor - muito bom (embora eu ache que ainda é um pouco caro)
13,42K