Вже три дні з перервами користуюся кодом Клода (opus 4.5), намагаючись розібратися з класичним статистичним експериментом Він часто вигадує ідеї для хаку, запускає симуляції з тонкими багами або вибирає дивні дегенеративні гіперпараметри для винагороди за хак Крім того, коли він запускає експеримент, у нього дуже поганий детектор нісенітниць, і він передає мені результати, які не проходять тест на запах Досить дивно, враховуючи мій досвід з Клодом в інших сферах Я досяг прогресу у покращенні шлейки, але частково це через те, що модель погано справляється з позавибірковою експериментальною статистикою