🚀 Představujeme SWE-Bench Pro – nový benchmark pro hodnocení kódovacích agentů LLM na skutečných úlohách softwarového inženýrství na podnikové úrovni. Toto je další krok za SWE-Bench: tvrdší, odolný proti kontaminaci a blíže reálným repo.