トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1年前、未発表版の@OpenAI o3(High)のプレビューを確認しましたが、ARC-AGI-1で推定4.5k/タスクあたり88%のスコアを獲得しました
本日、新しいGPT-5.2 Pro(X-High)のSOTAスコアが90.5%で、1タスクあたり$11.64で確認されました
これは1年で約390倍の効率向上を示しています

また、GPT-5.2 Pro(High)はARC-AGI-2のSOTAであり、1タスクあたり$15.72で54.2%のスコアを獲得していることも確認しました
(APIのタイムアウトにより、GPT 5.2 Pro X-HighのARC-AGI-2での信頼性を信頼して検証できませんでした)
すべての検証済みGPT-5.2ファミリースコア:

ARC-AGIは2019年の目標として、AIを単なる暗記を超えて効率的な即時適応へと押し進めています
推論システムは今や単純な課題に対して真の流動的知性を示しています
この大幅な効率向上にもかかわらず、人間に対しては大きな差が残っています
2025年のグランプリ目標は1課題あたり0.20ドルであり、人間のエネルギー効率は桁違いに高いです
ARC-AGI-1およびARC-AGI-2からはまだ多くのことを学ぶべきです
ARC-AGI-3(2026年)はAIの能力と効率をさらに推進します
AIが新しい環境で効率的に学習し一般化する能力を測定するために設計されており、これは初のインタラクティブ推論ベンチマークとなります
続報をお楽しみに
わずか数ヶ月でAIの最前線を試す数百本の新作ゲームをリリースするのがワクワクするなら、ARC-AGI-3のエンジニアリングチームに参加してください

44.58K
トップ
ランキング
お気に入り
