熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
好的,我想我的實驗讓 AI 24/7 工作到此結束。這行不通。代碼的複雜性爆炸,結果並不理想,AI 無法突破困難的牆壁(它仍然完全無法甚至 *理解* SupGen),而且成本極高(在過去兩天花了約 1k)。最佳結果出現在 JS 編譯器上,主要是因為它熟悉(與 inets 相比),但不值得失去對代碼庫的控制。
我認為讓 AI 在背景中工作並在重要的事情上取得真正進展(即,真正的新事物)的夢想還未實現。它仍然是一台被困在自己訓練數據中的機器,無法跳出框架思考。它非常適合構建已經建好的東西。但不適合新事物。
此外,編碼通常有一個被低估的優勢,那就是你同時在做兩件事:構建代碼庫 *和* 學習它。AI 只做了一半。另一半顯然是不可能的 🤔
或者我只是無法忍受回答愚蠢的問題
說真的,GPT-5.3 *無法溝通*。它寫了很多東西,然後問你有關它自己代碼的問題。就好像你寫過一樣。假設你知道它在說什麼
它對發生的事情沒有心理模型
或者我只是無法忍受回答愚蠢的問題
說真的,GPT-5.3 *無法溝通*。它寫了很多東西,然後問你有關它自己代碼的問題。就好像你寫過一樣。假設你知道它在說什麼
它根本沒有心智理論。
我懷念3.5版的詩篇,當時AI只是個被美化的自動補全。也許我應該給4.6版一個更大的機會。當然,它比5.3版的邏輯錯誤更多,但它的其他方面都讓人感到更愉悅。如果我已經把所有邏輯都說出來了……那又何妨呢?
我懷念3.5版的詩篇,當時AI只是個被美化的自動補全。也許我應該給4.6版更多的機會。當然,它的邏輯錯誤比5.3版多,但其他方面都讓人感到更愉悅。如果我反正要把所有邏輯都拼出來……那為什麼不呢?
今早:
「Bend→JS 機器人完全停滯不前。代理已經耗盡了簡單的勝利,現在正在嘗試越來越絕望的微優化,但都失敗了。自從最初的勝利約 50 輪前以來,基準測試沒有任何變化。」
其他機器人也遭遇了類似的命運 ):
今早:
「Bend→JS 機器人完全停滯不前。代理已經耗盡了簡單的獲勝機會,現在正在嘗試越來越絕望的微優化,但都失敗了,同時詢問有關 V8 內部的問題。基準測試自大約 50 輪前以來完全沒有變化。」
嘆氣
92
熱門
排行
收藏
