Okej, jag tror mitt experiment med att låta AI arbeta med saker dygnet runt slutar här. Det fungerar inte. Koden exploderar i komplexitet, resultaten är inte så bra, AI:n kan inte ta sig förbi hårda väggar (den kan fortfarande inte ens *greppa* SupGen), och det är vansinnigt dyrt (spenderat ~1 000 dollar de senaste två dagarna). De bästa resultaten finns på JS-kompilatorn, mest för att den är bekant (jämfört med inets), men inte värd att förlora kontrollen över kodbasen. Jag tror att drömmen om att ha AI:er som arbetar i bakgrunden och göra verkliga framsteg med viktiga saker (dvs. verkligt nya saker) inte är här än. Det är fortfarande en maskin som fastnat i sin egen träningsdata, oförmögen att tänka utanför boxen. Det är utmärkt för att bygga saker som redan är byggda. Men inte nya saker Dessutom har kodning oftast den underskattade fördelen att du gör två saker samtidigt: bygger en kodbas *och* lär dig den. AI:er gör bara hälften av det. Den andra halvan är uppenbarligen omöjlig 🤔
eller så står jag bara inte ut med att svara på dumma frågor Allvarligt talat, GPT-5.3 *kan inte kommunicera*. den skriver massor av saker och ställer sedan DIG frågor om sin egen kod. som om du hade skrivit den. förutsatt att du vet vad den pratar om Den har ingen mental modell av vad som pågår
eller så står jag bara inte ut med att svara på dumma frågor Allvarligt talat, GPT-5.3 *kan inte kommunicera*. den skriver massor av saker och ställer sedan DIG frågor om sin egen kod. som om du hade skrivit den. förutsatt att du vet vad den pratar om Den har ingen teori om sinnet. Inte alls.
Jag missade Sonnett 3,5 gånger när AI bara var en glorifierad autokomplettering. kanske borde jag ge Opus 4.6 en större chans. Visst gör den fler logiska misstag än GPT 5.3, men allt annat med den är så mycket mer tillfredsställande. och om jag ska förklara all logik så är det ändå... Varför inte?
Jag missade Sonnett 3,5 gånger när AI bara var en glorifierad autokomplettering. kanske borde jag ge Opus 4.6 en större chans. Visst gör den fler logiska misstag än GPT 5.3, men allt annat med den är så mycket mer tillfredsställande. och om jag ändå ska stava ut all logik... Varför inte?
I morse: "Bend→JS-boten är helt fast. Agenten har uttömt de enkla vinsterna och försöker nu alltmer desperata mikrooptimeringar som alla misslyckas. Riktmärkena har inte rört sig sedan de första vinsterna landade för ~50 rundor sedan." Andra botar råkar ut för liknande öde):
I morse: "Bend→JS-boten är helt fast. Agenten har uttömt de enkla vinsterna och försöker nu alltmer desperata mikrooptimeringar som alla misslyckas, samtidigt som han ställer frågor om V8:s interna system. Benchmark-värdena har inte rört sig alls sedan ~50 skott sedan." suckar
96