Vor einem Jahr haben wir eine Vorschau auf eine unveröffentlichte Version von @OpenAI o3 (Hoch) verifiziert, die 88 % auf ARC-AGI-1 erzielte bei geschätzten 4.500 $/Aufgabe. Heute haben wir einen neuen GPT-5.2 Pro (X-Hoch) SOTA-Wert von 90,5 % bei 11,64 $/Aufgabe verifiziert. Dies stellt eine ~390-fache Effizienzsteigerung innerhalb eines Jahres dar.
Wir haben auch verifiziert, dass GPT-5.2 Pro (Hoch) SOTA für ARC-AGI-2 ist und 54,2 % für $15,72/Aufgabe erzielt. (Wegen API-Zeitüberschreitungen konnten wir GPT 5.2 Pro X-Hoch auf ARC-AGI-2 nicht zuverlässig verifizieren) Alle verifizierten GPT-5.2-Familienwerte:
ARC-AGI erreicht sein Ziel von 2019, KI über das Auswendiglernen hinaus zu bringen, hin zu effizienter Anpassung in Echtzeit Denksysteme zeigen jetzt echte fluide Intelligenz bei einfachen Aufgaben
Selbst mit dieser großen Effizienzsteigerung bleibt eine große Lücke im Vergleich zu Menschen Das Ziel des Grand Prize 2025 lag bei $0,20/Aufgabe und Menschen sind in Bezug auf den Energieverbrauch um mehrere Größenordnungen effizienter Es gibt noch viel von ARC-AGI-1 und ARC-AGI-2 zu lernen
ARC-AGI-3 (2026) wird die KI-Fähigkeit und Effizienz noch weiter vorantreiben Entwickelt, um die Fähigkeit von KI zu messen, effizient in neuartigen Umgebungen zu lernen und zu verallgemeinern, wird es ein einzigartiger interaktiver Bewertungsmaßstab für das logische Denken sein Bleiben Sie dran
Wenn es aufregend klingt, in nur wenigen Monaten Hunderte neuartiger Spiele zu versenden, die die Grenzen von AI testen, dann schließe dich dem Engineering-Team an, das ARC-AGI-3 erstellt.
44,5K