.@poetiq_ai 是一家新創公司,最近在 ARC-AGI 基準上取得了重大進展,通過在現有模型之上層疊一個遞歸自我改進系統。 在這一集的 @LightconePod 中,Poetiq 的創始人兼 CEO @itfische 與我們討論了小團隊如何構建“推理工具”,以超越基礎模型,這對新創公司意味著什麼,以及為什麼自動化提示工程可能是當今 AI 中最強大的杠杆之一。 00:00 – 介紹 00:40 – Poetiq 是什麼? 01:07 – 遞歸自我改進解釋 02:07 – 微調陷阱 02:59 – LLM 的“支撐物” 03:14 – 遞歸自我改進 vs. 微調 05:05 – 在 ARC-AGI 上奪得第一名 06:37 – 在人類的最後考試中擊敗 Claude 08:40 – 元系統如何運作 10:26 – 超越強化學習:一個新的 S 曲線 11:32 – 自動化提示工程 13:37 – 從 5% 到 95% 的性能 14:50 – 早期訪問 & 將您的代理放在支撐物上 16:17 – 從 YC 創始人到 DeepMind 研究員 18:29 – 對 AI 時代工程師的建議