Estimamos que GPT-5.3-Codex con un esfuerzo de razonamiento `alto` (no `muy alto`) tiene un horizonte temporal del 50% de alrededor de 6.5 horas (IC del 95% de 3 horas a 17 horas) en nuestra suite de tareas de software. OpenAI proporcionó acceso a la API para esta evaluación.