跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+1.99%
USELESS
+4.65%
IKUN
+13.18%
gib
+2.63%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+0.02%
ALON
-14.03%
LAUNCHCOIN
+8.64%
GOONC
-1.32%
KLED
+15.22%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.74%
Boopa
+5.24%
PORK
0.00%
主页
Andy Hall
@ 斯坦福大学 GSB 教授,胡佛。我从事技术、政治和治理方面的工作。a16z crypto 和 Meta 的顾问。
查看原文
Andy Hall
8 小时前
我的LLM委员会在我今天的代理人群体写的这篇论文中看到了相当大的红旗 🤣
2.78K
Andy Hall
1月10日 03:30
正在测试Waymo的高速公路通行。我们在280号公路的中间车道上,正好以65英里每小时的速度行驶。人类司机在我们两侧飞驰而过,哈哈。
116
Andy Hall
1月10日 00:08
上周末我发布了Claude Code在一个小时内创建了一个完整的实证政治学研究的消息。很多人问:这个研究的准确性如何? 答案是:相当准确,虽然有一些有趣的错误和重要的局限性。 为了得到答案,Graham Straus好心地提供了进行独立手动审计的服务——收集相同的数据,并像Claude那样扩展论文,但不使用任何AI。他发现了以下内容: Claude完全复制了原始论文,正确编码了29/30个加州县的处理时间,并收集的选举数据与手动收集的数据相关性超过0.999。 Graham发现的三个主要错误——错误编码一个县的处理年份,遗漏了对几个在始终处理州中可能相关的竞选的数据显示,以及没有使用非总统选举来计算投票率——类似于人类在第一次撰写这篇论文时可能犯的错误,并且对后续估计的影响很小。 另一方面,当Claude试图创建一些不是原始论文简单扩展的新分析时,效果就差了。没有幻觉或疯狂的错误,但它偏离了提示,产生了我们认为构思不佳的结果。 我的看法: –今天的AI已经是快速更新和扩展良好封闭、简单实证论文的极其强大的方式。 –要做好实证社会科学研究,绝对需要人类专家的指导和监督。 下周我将在我的博客上分享关于这项工作的更广泛的想法,我们通过这项工作学到了什么,以及我们接下来要去哪里。感谢许多与我联系、提出问题并对这个项目提供反馈的人。
266
热门
排行
收藏