Tiêu chuẩn lập trình AI mới: SWE-Bench-Pro. * Thách thức hơn - các mô hình hàng đầu đạt khoảng 23% trên SWE-Bench-PRO so với 70% trên SWE-Bench trước đó * Giảm thiểu vấn đề ô nhiễm dữ liệu thông qua nguồn cung cấp riêng và một bộ dữ liệu giữ lại * Tăng cường sự đa dạng và tính thực tế của các nhiệm vụ