🚀 Einführung von SWE-Bench Pro – ein neuer Benchmark zur Bewertung von LLM-Coding-Agenten bei realen, unternehmensgerechten Software-Engineering-Aufgaben. Dies ist der nächste Schritt über SWE-Bench hinaus: schwieriger, kontaminationsresistent und näher an realen Repos.