熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
如果你在想,飽和 ARC-AGI-1 或 2 是否意味著我們現在擁有 AGI... 我想起了去年我們推出 ARC-AGI-2 時所說的話(這也是我在 2022 年春季宣布 ARC-AGI-2 即將推出時所說的話,在 LLM 聊天機器人興起之前)...
ARC-AGI 系列並不是 AGI 的門檻,而是一個指引,指向研究社群應該關注的正確問題。
ARC-AGI-1 是一個流動智力的最小測試——要通過它,你需要展示非零的流動智力。這要求 AI 超越經典的深度學習 / LLM 模式,即預訓練擴展 + 靜態模型推理,朝向測試時適應。
ARC-AGI-2 也是如此,但任務探測更深層次的推理複雜性(特別是關於概念組合)。不過,這些任務是普通人可以在幾分鐘內解決的,無需使用外部工具(我們是從街上聘請的測試者),因此它並不代表人類流動智力可以達到的上限(例如,解決千禧年問題)。
ARC-AGI-3(將於 2026 年 3 月推出)探測互動推理:我們評估系統如何探索未知環境,建模它們,設定自己的目標,並自主地計劃/執行這些目標,而無需指示。
我們也已經開始著手 ARC-AGI-4 和 ARC-AGI-5 的工作,我對此感到非常興奮!

熱門
排行
收藏
