نقدر أن GPT-5.3-Codex مع جهد استدلالي 'عالي' (وليس 'xhigh') لديه أفق زمني يبلغ حوالي 6.5 ساعات (فاصل الثقة 95٪ من 3 ساعات إلى 17 ساعة) في مجموعة مهام البرمجيات لدينا. وفرت OpenAI الوصول إلى واجهة برمجة التطبيقات لهذا التقييم.