🚀 نقدم لكم SWE-Bench Pro - معيار جديد لتقييم وكلاء ترميز LLM في مهام هندسة البرمجيات الحقيقية على مستوى المؤسسة. هذه هي الخطوة التالية وراء SWE-Bench: أصعب ومقاومة للتلوث وأقرب إلى المستودعات في العالم الحقيقي.