跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-34.36%
USELESS
+0.21%
IKUN
-21.69%
gib
+8.16%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-2.44%
ALON
+15.5%
LAUNCHCOIN
-1.08%
GOONC
-2.19%
KLED
-6.7%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.07%
Boopa
+0.88%
PORK
0.00%
主頁
Valerio Capraro
米蘭比科卡大學副教授。我寫的是關於社交行為和人工智慧的文章。
查看原文
Valerio Capraro
1月5日 22:32
這令人深感不安。 研究人員更可能選擇其結果與其意識形態前提一致的統計模型。 七十一個研究團隊獨立分析了相同的數據集,研究移民對社會福利計劃的公共支持影響。 由支持移民的研究人員組成的團隊更可能得出影響是正面的結論。由反對移民的研究人員組成的團隊則更可能發現負面影響。 我再重申一次:他們分析的實際上是相同的數據集。 完整論文在第一條評論中。
Valerio Capraro
2025年12月23日
重磅預印本剛剛發布! 我們比較了人類和大型語言模型(LLMs)在七個認識論階段形成判斷的方式。 我們突出了七個斷層線,即人類和LLMs根本分歧的點: 基礎斷層:人類的判斷基於感知、具身和社會經驗,而LLMs僅從文本開始,間接地從符號重建意義。 解析斷層:人類通過整合的感知和概念過程解析情境;LLMs則進行機械的標記化,產生結構上方便但語義上薄弱的表示。 經驗斷層:人類依賴情節記憶、直觀的物理學和心理學以及學習的概念;LLMs僅依賴於嵌入中編碼的統計關聯。 動機斷層:人類的判斷受到情感、目標、價值觀和進化塑造的動機的指導;LLMs沒有內在的偏好、目標或情感意義。 因果斷層:人類使用因果模型、反事實和原則性評估進行推理;LLMs整合文本上下文而不構建因果解釋,而是依賴於表面相關性。 元認知斷層:人類監控不確定性、檢測錯誤並能夠暫停判斷;LLMs缺乏元認知,必須始終產生輸出,這使得幻覺在結構上無法避免。 價值斷層:人類的判斷反映身份、道德和現實世界的利害關係;LLM的“判斷”是沒有內在評價或問責的概率下一個標記預測。 儘管存在這些斷層,人類系統性地過度相信LLM的輸出,因為流利和自信的語言產生了可信度偏見。 我們認為這創造了一種結構性條件,稱為Epistemia: 語言的可信度取代了認識評估,產生了知道的感覺而實際上並不知道。 為了解決Epistemia,我們提出了三種互補策略:認識評估、認識治理和認識素養。 完整論文在第一條回覆中。 與@Walter4C和@matjazperc聯合發表
130
Valerio Capraro
2025年12月20日
在《科學》期刊上發表了一篇引人入勝的論文。 作者分析了多個領域頂尖表現者的職業軌跡,包括諾貝爾獎得主、精英棋手、奧運金牌得主等。 他們的核心發現挑戰了一個普遍的信念。 在年輕時進行密集的單一學科訓練確實會帶來早期優勢,但這種優勢隨著時間的推移而減弱。 相比之下,早期接觸多學科實踐的個體往往起步較慢。然而,從長遠來看,他們更有可能達到世界級的表現,最終超越那些早期專家,後者往往在接近頂尖時停滯不前。 這是一個重要的提醒,早期的廣度可以是對長期卓越的強大投資。 論文鏈接在第一條回覆中。
160
熱門
排行
收藏