Hvis du lurer på om det å mette ARC-AGI-1 eller 2 betyr at vi nå har AGI... Jeg henviser til det jeg sa da vi lanserte ARC-AGI-2 i fjor (som også er det samme jeg sa da vi kunngjorde at ARC-AGI-2 skulle komme, våren 2022, før LLM-chatbotene dukket opp)... ARC-AGI-serien er ikke en AGI-terskel, det er et kompass som peker forskningsmiljøet mot de riktige spørsmålene. ARC-AGI-1 er en minimal test av flytende intelligens – for å bestå den måtte du vise ikke-null flytende intelligens. Dette krevde at AI gikk forbi det klassiske dyplærings-/LLM-paradigmet med forhåndstrening av skalering + statiske modeller ved inferens, mot testtidstilpasning. ARC-AGI-2 er det samme, men med oppgaver som undersøker dypere nivåer av resonnementskompleksitet (spesielt med hensyn til konseptkomposisjon). Likevel er dette oppgaver som kan løses på minutter av vanlige folk uten ekstern verktøybruk (vi ansatte våre testtakere fra gaten), så det representerer ikke den øvre grensen for hva menneskelig flytende intelligens kan oppnå (for eksempel å løse et millenniumproblem). ARC-AGI-3 (lanseres mars 2026) undersøker interaktiv resonnement: vi evaluerer hvordan systemer utforsker ukjente miljøer, modellerer dem, setter egne mål, og planlegger/gjennomfører mot disse målene, autonomt, uten instruksjoner. Vi har også startet arbeidet med ARC-AGI-4 og ARC-AGI-5, noe jeg er ganske spent på!