🚀 Vi presenterar SWE-Bench Pro — ett nytt riktmärke för att utvärdera LLM-kodningsagenter på verkliga programvaruutvecklingsuppgifter i företagsklass. Detta är nästa steg bortom SWE-Bench: hårdare, kontamineringsresistent och närmare verkliga repos.