DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Même après les progrès rapides des 3 derniers mois, il reste que la performance de l'IA est liée à la familiarité avec la tâche. Dans les domaines qui peuvent être échantillonnés de manière dense (via génération et vérification programmatiques), la performance est effectivement illimitée et continuera d'augmenter par rapport aux niveaux actuels. Dans des domaines nouveaux et inconnus, la performance reste faible et des progrès supplémentaires nécessitent encore de nouvelles idées, pas seulement plus de données et de puissance de calcul.

Pour les benchmarks qui ciblent des tâches nouvelles, une forme courante de hacking de benchmark qui exploite cette lacune consiste à générer un échantillonnage dense de tâches potentielles en paramétrant manuellement l'espace, puis en le forçant par brute force. Très coûteux mais ça fonctionne. Il y a peu de choses que vous pouvez faire pour restaurer la validité du benchmark ici, à part augmenter la dimensionnalité de l'espace des tâches.

47

Meilleurs

Classement

Favoris