DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

METR:s senaste utvärderingar visar att GPT-5,2 (Hög) når en "50%-tidshorisont" på 6,6 timmar. För dem som inte vet mäter deras metodik autonom förmåga genom att tajma hur lång tid en mänsklig expert tar på sig att slutföra en uppgift som AI:n nu kan slutföra framgångsrikt hälften av gångerna. Jag talade om "Light Takeoff" med OpenAI och detta är ytterligare bevis. Denna bana är definitionen av lätt start – en jämn men verklig exponentiell acceleration. Fördubblingstiden har krympt från 212 dagar till bara 128 dagar. Detta 6,6-timmarsrekord sattes med "Hög" resonemangsinsats, inte den ännu kraftfullare "XHigh"-inställningen. Med GPT-5.2 som redan slår Claude 4.5 Opus (5,3 timmar) med 25 %, kommer "XHigh"-versionen sannolikt att horisonten passerar 10+ timmar. Detta bevisar att OpenAI framgångsrikt skalar resonerande beräkning. Och det här är inte ens 5,3!

Topp

Rankning

Favoriter