跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-20.18%
USELESS
+0.18%
IKUN
-11%
gib
+1.11%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-3.86%
ALON
-6.71%
LAUNCHCOIN
-7.99%
GOONC
-0.92%
KLED
+4.23%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.48%
Boopa
-0.09%
PORK
0.00%
主頁
George Tsoukalas
德克薩斯大學奧斯汀分校的博士生對自動定理證明感興趣。
查看原文
George Tsoukalas
2025年12月31日
在 PutnamBench 中修正了 15 個錯誤的形式化(大約佔基準的 2%),感謝 Logical Intelligence 貢獻這些變更,這些變更是由他們的 Aleph Prover 系統識別的(恰好,目前也是 PB 排行榜上最強的方案)!
56
George Tsoukalas
2025年12月4日
來參加我們的海報,了解正式驗證的代碼生成新基準,時間從現在到7:30,地點在#1411 Exhibit CDE!!
65
George Tsoukalas
2025年12月2日
PutnamBench 排行榜上的新領導者!現在接近飽和,下一個大目標將是優化相同證明性能的成本!恭喜 Logical Intelligence 團隊!
Logical Intelligence
2025年12月2日
我們的 Aleph 證明者代理剛剛在 PutnamBench 上達到第 #1,這是一個基於 Putnam 問題建立的基準 - Putnam 問題是最難的大学数学奥林匹克之一 - 完全以機器檢查的證明形式化,且沒有任何人類參與。Putnam 問題通常被認為比 IMO 問題更難,涵蓋了廣泛的主題,包括微積分、數論、群論以及其他數學的核心領域。 這是強有力的證據,表明 AI 能夠處理深度的多步推理並提供正確性保證——這正是我們用來驗證真正的軟體、硬體和需要形式邏輯的科學發現的技術。
49
熱門
排行
收藏