热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
.@poetiq_ai 是一家新创公司,最近在 ARC-AGI 基准测试中取得了重大进展,通过在现有模型上叠加递归自我改进系统。
在本期 @LightconePod 中,Poetiq 的创始人兼首席执行官 @itfische 加入我们,讨论小团队如何构建“推理工具”,以超越基础模型,这对初创公司意味着什么,以及为什么自动化提示工程可能是当今 AI 中最强大的杠杆之一。
00:00 – 引言
00:40 – 什么是 Poetiq?
01:07 – 递归自我改进解释
02:07 – 微调陷阱
02:59 – LLM 的“支架”
03:14 – 递归自我改进与微调
05:05 – 在 ARC-AGI 中占据首位
06:37 – 在人类最后的考试中击败 Claude
08:40 – 元系统如何运作
10:26 – 超越 RL:新的 S 曲线
11:32 – 自动化提示工程
13:37 – 从 5% 到 95% 的性能
14:50 – 早期访问与将您的代理放在支架上
16:17 – 从 YC 创始人到 DeepMind 研究员
18:29 – 对 AI 时代工程师的建议
热门
排行
收藏
