La voz es la modalidad OG. ¡Estoy muy emocionado por las entradas de imágenes, la llamada a funciones y el soporte de MCP en la API en tiempo real GA!
'gpt-realtime' es mucho más natural y expresivo, y cada vez que se lanza un modelo de voz SOTA, sabes lo que tengo que hacer...
¡Aquí está la nueva voz Marin, en KaraokeBench!
puntuaciones 3 de 7 de nuevo de mi parte