热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
好的,我想我的实验让AI全天候工作到此为止。它不起作用。代码的复杂性爆炸,结果并不理想,AI无法突破硬壁垒(它仍然完全无法*理解* SupGen),而且成本极高(在过去两天花费了大约1000美元)。最佳结果出现在JS编译器上,主要是因为它比较熟悉(与inets相比),但失去对代码库的控制是不值得的。
我认为让AI在后台工作并在重要事情上取得真正进展(即,真正的新事物)的梦想还没有实现。它仍然是一台被困在自己训练数据中的机器,无法跳出框框思考。它非常适合构建已经构建的东西,但不适合新事物。
此外,正常编码有一个被低估的优势,那就是你同时在做两件事:构建代码库*和*学习它。AI只做了一半。另一半显然是不可能的 🤔
或者我只是无法忍受回答愚蠢的问题
说真的,GPT-5.3 *无法沟通*。它写了很多东西,然后问你关于它自己代码的问题。就好像你写过一样。假设你知道它在说什么
它对发生的事情没有心理模型
或者我只是受不了回答愚蠢的问题
说真的,GPT-5.3 *无法沟通*。它写了很多东西,然后问你关于它自己代码的问题。就好像你写过一样。假设你知道它在说什么
它根本没有心智理论。
我怀念3.5版的诗歌,当时AI只是一个被美化的自动补全。也许我应该给4.6版一个更大的机会。虽然它比5.3版犯更多逻辑错误,但它的其他方面都令人愉悦。如果我反正要把所有逻辑都说出来……那为什么不呢?
我怀念3.5版的诗歌,当时的AI只是一个被美化的自动补全。也许我应该给4.6版一个更大的机会。虽然它的逻辑错误比gpt 5.3多,但其他方面都让人感觉愉悦。如果我反正要把所有逻辑都拼出来……那为什么不呢?
今早:
“Bend→JS 机器人完全停滞不前。代理已经耗尽了简单的胜利,现在正在尝试越来越绝望的微优化,但都失败了。自从最初的胜利大约 50 轮前以来,基准测试没有任何变化。”
其他机器人也遭遇了类似的命运 ):
今早:
“Bend→JS 机器人完全停滞不前。代理已经耗尽了简单的胜利,现在正在尝试越来越绝望的微优化,但都失败了,同时询问关于 V8 内部的相关问题。基准测试自大约 50 轮前以来完全没有变化。”
叹气
103
热门
排行
收藏
