Outra nova referência: - O OpenAI é mais econômico em todas as tarefas; GPT-5 (alto raciocínio) é forte em preço + inteligência - Anthropic lidera o sucesso bruto (dois primeiros; rápido em tarefas difíceis) o benchmark testa a compilação de ponta a ponta de OSS real sob condições confusas do mundo real