🚀 Presentiamo SWE-Bench Pro — un nuovo benchmark per valutare gli agenti di codifica LLM su compiti di ingegneria del software reali e di livello enterprise. Questo è il passo successivo oltre SWE-Bench: più difficile, resistente alla contaminazione e più vicino ai repository del mondo reale.