Новый эталон кодирования AI: SWE-Bench-Pro. * Более сложный - топовые модели набирают около 23% на SWE-Bench-PRO по сравнению с 70% на предыдущем SWE-Bench * Снижает проблемы с загрязнением данных за счет частного источника и контрольного набора * Увеличивает разнообразие и реализм задач