🚀 Apresentando o SWE-Bench Pro - um novo benchmark para avaliar agentes de codificação LLM em tarefas reais de engenharia de software de nível empresarial. Este é o próximo passo além do SWE-Bench: mais duro, resistente à contaminação e mais próximo dos repositórios do mundo real.