Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nếu bạn đang tự hỏi liệu việc bão hòa ARC-AGI-1 hoặc 2 có nghĩa là chúng ta đã có AGI chưa... Tôi xin nhắc lại những gì tôi đã nói khi chúng tôi ra mắt ARC-AGI-2 vào năm ngoái (điều này cũng giống như những gì tôi đã nói khi chúng tôi thông báo rằng ARC-AGI-2 sẽ ra mắt, vào mùa xuân năm 2022, trước sự trỗi dậy của các chatbot LLM)...
Chuỗi ARC-AGI không phải là một ngưỡng AGI, mà là một la bàn chỉ hướng cho cộng đồng nghiên cứu đến những câu hỏi đúng.
ARC-AGI-1 là một bài kiểm tra tối thiểu về trí thông minh linh hoạt - để vượt qua nó, bạn cần phải chứng minh trí thông minh linh hoạt không bằng không. Điều này yêu cầu AI phải vượt qua mô hình học sâu cổ điển / LLM với quy mô tiền huấn luyện + mô hình tĩnh trong suy diễn, hướng tới việc thích ứng trong thời gian kiểm tra.
ARC-AGI-2 cũng giống như vậy, nhưng với các nhiệm vụ thăm dò các mức độ phức tạp lý luận sâu hơn (đặc biệt liên quan đến việc kết hợp khái niệm). Tuy nhiên, đây vẫn là những nhiệm vụ mà người bình thường có thể giải quyết trong vài phút mà không cần sử dụng công cụ bên ngoài (chúng tôi đã thuê những người tham gia kiểm tra từ ngoài đường), vì vậy nó không đại diện cho giới hạn tối đa mà trí thông minh linh hoạt của con người có thể đạt được (chẳng hạn, giải quyết một vấn đề Thiên niên kỷ).
ARC-AGI-3 (ra mắt vào tháng 3 năm 2026) thăm dò lý luận tương tác: chúng tôi đánh giá cách các hệ thống khám phá các môi trường chưa biết, mô hình hóa chúng, đặt ra các mục tiêu của riêng mình và lập kế hoạch/thực hiện hướng tới những mục tiêu này, một cách tự động, không cần hướng dẫn.
Chúng tôi cũng đã bắt đầu công việc trên ARC-AGI-4 và ARC-AGI-5, điều mà tôi rất hào hứng!

Hàng đầu
Thứ hạng
Yêu thích
