DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Selbst nach dem steilen Fortschritt der letzten 3 Monate bleibt es dabei, dass die Leistung von AI an die Vertrautheit mit Aufgaben gebunden ist. In Bereichen, die dicht gesampelt werden können (durch programmatische Generierung + Verifizierung), ist die Leistung effektiv unbegrenzt und wird weiterhin von den aktuellen Niveaus ansteigen. In neuartigen, unbekannten Bereichen bleibt die Leistung niedrig und weiterer Fortschritt erfordert weiterhin neue Ideen, nicht nur mehr Daten und Rechenleistung.

Für Benchmarks, die neuartige Aufgaben anvisieren, ist eine gängige Form des Benchmark-Hackings, die diese Lücke ausnutzt, eine dichte Stichprobe potenzieller Aufgaben zu generieren, indem der Raum manuell parametrisiert und dann mit Brute-Force angegangen wird. Sehr teuer, aber es funktioniert. Es gibt wenig, was Sie tun können, um die Validität des Benchmarks hier wiederherzustellen, außer die Dimensionalität des Aufgabenraums zu erhöhen.

58

Top

Ranking

Favoriten