Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Даже после резкого прогресса за последние 3 месяца, производительность ИИ по-прежнему зависит от знакомства с задачей. В областях, которые можно плотно исследовать (через программную генерацию + верификацию), производительность фактически не ограничена и будет продолжать расти с текущих уровней. В новых, незнакомых областях производительность остается низкой, и дальнейший прогресс по-прежнему требует новых идей, а не только больше данных и вычислительных мощностей.

16 часов назад
Хорошо, я думаю, что мой эксперимент с тем, чтобы оставить ИИ работать над задачами 24/7, заканчивается здесь. Это не работает. Код взрывается от сложности, результаты не такие уж и хорошие, ИИ не может преодолеть серьезные преграды (он по-прежнему совершенно не способен даже *осознать* SupGen), и это безумно дорого (потратил около 1k за последние 2 дня). Лучшие результаты на компиляторе JS, в основном потому, что он знаком (по сравнению с inets), но не стоит терять контроль над кодовой базой.
Я думаю, что мечта о том, чтобы ИИ работали в фоновом режиме и добивались реального прогресса в важных вещах (т.е. действительно новых вещах) еще не осуществилась. Это все еще машина, жестко застрявшая на своих собственных обучающих данных, неспособная мыслить нестандартно. Она отлично подходит для создания вещей, которые уже были созданы. Но не для новых вещей.
Кроме того, программирование обычно имеет недооцененное преимущество в том, что вы делаете две вещи одновременно: создаете кодовую базу *и* изучаете ее. ИИ делает только половину из этого. Вторая половина, очевидно, невозможна 🤔
Для бенчмарков, нацеленных на новые задачи, распространенной формой взлома бенчмарков, которая использует этот разрыв, является создание плотной выборки потенциальных задач путем ручного параметрирования пространства, а затем его грубой силы. Очень дорого, но это работает. Мало что можно сделать, чтобы восстановить действительность бенчмарка, кроме как увеличить размерность пространства задач.
49
Топ
Рейтинг
Избранное
