Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Incluso tras el fuerte avance de los últimos 3 meses, sigue siendo que el rendimiento de la IA está ligado a la familiaridad con las tareas. En dominios que pueden ser muestreados densamente (mediante generación + verificación programática), el rendimiento es efectivamente ilimitado y seguirá aumentando respecto a los niveles actuales. En dominios nuevos y desconocidos, el rendimiento sigue siendo bajo y el progreso aún requiere nuevas ideas, no solo más datos y cálculo.

Para benchmarks que apuntan a tareas novedosas, una forma común de hacking de benchmarks que arbitra esta brecha es generar un muestreo denso de tareas potenciales parametrizando manualmente el espacio y luego forzarlo por fuerza bruta. Muy caro, pero funciona. Aquí poco se puede hacer para restaurar la validez de los benchmarks aparte de aumentar la dimensionalidad del espacio de tareas.

65

Populares

Ranking

Favoritas