跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+22.55%
USELESS
+1%
IKUN
+1.57%
gib
+3.54%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-3.04%
ALON
+34.61%
LAUNCHCOIN
+0.82%
GOONC
+2.49%
KLED
+4.83%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.48%
Boopa
+0.35%
PORK
0.00%
主页
George Tsoukalas
德克萨斯大学奥斯汀分校的博士生对自动定理证明感兴趣。
查看原文
George Tsoukalas
2025年12月31日
在 PutnamBench 中修复了 15 个误格式化(大约占基准的 2%),感谢 Logical Intelligence 贡献的更改,这些更改是通过他们的 Aleph Prover 系统识别的(恰好也是目前 PB 排行榜上最强的方案)!
33
George Tsoukalas
2025年12月4日
来参加我们关于正式验证代码生成的新基准的海报展示,时间从现在到7:30,地点在#1411 展览CDE!!
48
George Tsoukalas
2025年12月2日
PutnamBench 排行榜上的新领袖!现在接近饱和,下一大目标将是优化相同证明性能的成本!祝贺 Logical Intelligence 团队!
Logical Intelligence
2025年12月2日
我们的 Aleph 证明代理刚刚在 PutnamBench 上获得了第一名,这是一个基于 Putnam 问题构建的基准测试——Putnam 问题是最难的大学级数学奥林匹克之一——完全通过机器检查的证明形式化,没有人类参与。Putnam 问题通常被认为比 IMO 问题更难,涵盖了广泛的主题,包括微积分、数论、群论和其他核心数学领域。 这强有力地证明了 AI 可以处理深度的多步骤推理,并提供正确性保证——我们正在使用的同种技术来验证需要形式逻辑的真实软件、硬件和科学发现。
32
热门
排行
收藏