🚀 Представляємо SWE-Bench Pro — новий бенчмарк для оцінки агентів кодування LLM на реальних завданнях програмної інженерії корпоративного рівня. Це наступний крок після SWE-Bench: міцніший, стійкий до забруднень і ближчий до реальних репозиторіїв.