🚀 Giới thiệu SWE-Bench Pro — một tiêu chuẩn mới để đánh giá các tác nhân lập trình LLM trên các nhiệm vụ kỹ thuật phần mềm thực tế, cấp doanh nghiệp. Đây là bước tiếp theo sau SWE-Bench: khó hơn, chống ô nhiễm tốt hơn và gần gũi hơn với các kho mã thực tế.