Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Son 3 aydaki büyük ilerlemeye rağmen, yapay zeka performansının göreve alışkanlığa bağlı olduğu hâlâ devam ediyor. Yoğun örneklenebilen alanlarda (programatik üretim + doğrulama ile), performans fiilen sınırsızdır ve mevcut seviyelerden artmaya devam eder. Yeni, alışılmadık alanlarda performans düşük kalıyor ve ilerleme için hâlâ yeni fikirler gerekiyor, sadece daha fazla veri ve hesaplama değil.

16 Sa Önce
Tamam, bence yapay zekayı 7/24 çalışırken bırakan deneyim burada sona eriyor. Çalışmıyor. Kod karmaşıklıkla patlıyor, sonuçlar pek iyi değil, yapay zeka sert duvarları aşamıyor (hâlâ SupGen'i tamamen kavrayamıyor) ve inanılmaz pahalı (son 2 günde ~1k harcamış). En iyi sonuçlar JS derleyicisinde oluyor, çoğunlukla tanıdık olduğu için (inetlere kıyasla), ama kod tabanı üzerindeki kontrolü kaybetmeye değmez.
Bence yapay zekaların arka plan üzerinde çalışıp önemli (yani gerçekten yeni şeyler) gerçek ilerleme kaydetmesi hayali henüz gelmedi. Hâlâ kendi eğitim verisine sıkışıp kalmış, kutunun dışında düşünemeyen bir makine. Zaten yapılmış şeyleri inşa etmek için harika. Ama yeni şeyler değil
Ayrıca kodlama genellikle aynı anda iki şeyi yapmak, yani bir kod tabanı oluşturmak *ve* öğrenmek gibi az takdir edilen bir avantaja sahiptir. Yapay zekalar bunun sadece yarısını yapıyor. Diğer yarısı ise açıkça imkansız 🤔
Yeni görevleri hedefleyen benchmarklar için, bu boşluğu arbitraj eden yaygın bir benchmark hackleme biçimi, alanı manuel olarak parametrize edip ardından brute-force yaparak potansiyel görevlerin yoğun bir örneklemesini oluşturmaktır. Çok pahalı ama işe yarıyor. Burada kıyaslama geçerliliğini geri getirmek için yapabileceğiniz çok az şey var, sadece görev alanının boyutluluğunu artırmaktır.
43
En İyiler
Sıralama
Takip Listesi
