🚀 Apresentando o SWE-Bench Pro — um novo benchmark para avaliar agentes de codificação LLM em tarefas reais de engenharia de software de nível empresarial. Este é o próximo passo além do SWE-Bench: mais difícil, resistente à contaminação e mais próximo de repositórios do mundo real.