🚀 Vă prezentăm SWE-Bench Pro - un nou punct de referință pentru evaluarea agenților de codare LLM pe sarcini reale de inginerie software la nivel de întreprindere. Acesta este următorul pas dincolo de SWE-Bench: mai dure, rezistent la contaminare și mai aproape de repo-urile din lumea reală.