🚀 Presentamos SWE-Bench Pro: un nuevo estándar para evaluar agentes de codificación LLM en tareas de ingeniería de software reales y de nivel empresarial. Este es el siguiente paso más allá de SWE-Bench: más difícil, resistente a la contaminación y más cercano a repositorios del mundo real.