DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Incluso después del fuerte progreso de los últimos 3 meses, sigue siendo cierto que el rendimiento de la IA está ligado a la familiaridad con la tarea. En dominios que pueden ser muestreados densamente (a través de generación y verificación programática), el rendimiento es efectivamente ilimitado y seguirá aumentando desde los niveles actuales. En dominios novedosos y no familiares, el rendimiento sigue siendo bajo y el progreso adicional aún requiere nuevas ideas, no solo más datos y computación.

Para los benchmarks que apuntan a tareas novedosas, una forma común de hackeo de benchmarks que arbitra esta brecha es generar una muestreo denso de tareas potenciales al parametrizar manualmente el espacio y luego forzarlo a la fuerza bruta. Muy costoso, pero funciona. Hay poco que se puede hacer para restaurar la validez del benchmark aquí, además de aumentar la dimensionalidad del espacio de tareas.

63

Parte superior

Clasificación

Favoritos