熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
AI 在 ICPC 世界總決賽中正式戰勝了我。
這讓我想起了一項罕見的 ICPC 技能:能夠快速閱讀隊友的代碼並發現錯誤。
這項技能需要多年的訓練,這也解釋了為什麼 AI 通常使編碼變得更慢(見 arXiv:2507.09089)。無論 AI 變得多強大,人類仍然可能需要花時間來驗證 AI 的輸出……
但想象一下,如果從明天開始 ChatGPT 的工作方式發生變化:不是用戶–代理聊天,而是用戶–代理–仲裁者的三方聊天。⚖️
代理(比如說 GPT-5)必須說服仲裁者(比如說 GPT-4o)其解決方案是正確的;用戶的角色是挑戰它並說服仲裁者反對。正如驗證 (P) 比發明 (NP) 更容易一樣,交互式證明 (IP) 路徑可以進一步減少所需的人類技能和時間。
這樣的 AI–仲裁者系統可能會將負擔轉移出人類,讓我們更少關注後勤(例如,校對代碼),而更多關注重要的決策。這會是通往下一代通用 AI 的道路嗎?🚀
熱門
排行
收藏