Se você está se perguntando se saturar ARC-AGI-1 ou 2 significa que agora temos AGI... Refiro-me ao que disse quando lançamos o ARC-AGI-2 no ano passado (que também foi a mesma coisa que disse quando anunciamos que o ARC-AGI-2 viria, na primavera de 2022, antes do surgimento dos chatbots LLM)... A série ARC-AGI não é um limiar de AGI, é uma bússola que aponta a comunidade de pesquisa para as questões certas. O ARC-AGI-1 é um teste mínimo de inteligência fluida — para passar, era necessário demonstrar inteligência fluida diferente de zero. Isso exigiu que a IA ultrapassasse o paradigma clássico de deep learning / LLM de pré-treino de escalonamento + modelos estáticos na inferência, rumo à adaptação no tempo do teste. O ARC-AGI-2 é igual, mas com tarefas que investigam níveis mais profundos de complexidade de raciocínio (particularmente no que diz respeito à composição de conceitos). Ainda assim, essas são tarefas que podem ser resolvidas em minutos por pessoas comuns sem uso de ferramentas externas (contratamos nossos candidatos na rua), então não representam o limite superior do que a inteligência fluida humana pode alcançar (por exemplo, resolver um problema do Milênio). O ARC-AGI-3 (lançamento em março de 2026) investiga o raciocínio interativo: avaliamos como os sistemas exploram ambientes desconhecidos, os modelamos, definem seus próprios objetivos e planejam/executam em direção a esses objetivos, de forma autônoma, sem instruções. Também começamos a trabalhar no ARC-AGI-4 e ARC-AGI-5, o que me deixa bastante animado!