.@poetiq_ai 是一家新创公司,最近在 ARC-AGI 基准测试中取得了重大进展,通过在现有模型上叠加递归自我改进系统。 在本期 @LightconePod 中,Poetiq 的创始人兼首席执行官 @itfische 加入我们,讨论小团队如何构建“推理工具”,以超越基础模型,这对初创公司意味着什么,以及为什么自动化提示工程可能是当今 AI 中最强大的杠杆之一。 00:00 – 引言 00:40 – 什么是 Poetiq? 01:07 – 递归自我改进解释 02:07 – 微调陷阱 02:59 – LLM 的“支架” 03:14 – 递归自我改进与微调 05:05 – 在 ARC-AGI 中占据首位 06:37 – 在人类最后的考试中击败 Claude 08:40 – 元系统如何运作 10:26 – 超越 RL:新的 S 曲线 11:32 – 自动化提示工程 13:37 – 从 5% 到 95% 的性能 14:50 – 早期访问与将您的代理放在支架上 16:17 – 从 YC 创始人到 DeepMind 研究员 18:29 – 对 AI 时代工程师的建议