محاولة منهجية لفهم مدى جودة GPT-5.2 Pro في مسائل إردوس، وهي مسائل رياضية صعبة وغالبا غير محلولة والتي نوقشت هنا كثيرا. الإجابة جيدة جدا! لكن أيضا يكون خاطئا في حوالي ثلث الوقت ولن تعرف ذلك لو لم تستطع التحقق من النتائج.