La voix est la modalité d'origine. Je suis tellement excité pour les entrées d'image, l'appel de fonction et le support MCP dans l'API Realtime GA ! `gpt-realtime` est beaucoup plus naturel et expressif, et chaque fois qu'un modèle vocal SOTA est publié, vous savez ce que je dois faire... Voici la nouvelle voix Marin, sur KaraokeBench ! Je lui donne encore 3 sur 7.
OpenAI
OpenAI29 août, 00:55
Présentation de gpt-realtime — notre meilleur modèle de conversion de la parole à la parole pour les développeurs, et mises à jour de l'API Realtime.
42,15K