DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Mesmo após o progresso acentuado dos últimos 3 meses, continua sendo que o desempenho da IA está ligado à familiaridade com as tarefas. Em domínios que podem ser densamente amostrados (via geração programática + verificação), o desempenho é efetivamente ilimitado e continuará aumentando a partir dos níveis atuais. Em domínios novos e desconhecidos, o desempenho permanece baixo e o progresso ainda exige novas ideias, não apenas mais dados e computação.

Para benchmarks que visam tarefas novas, uma forma comum de hacking de benchmarks que arbitra essa lacuna é gerar uma amostragem densa de tarefas potenciais parametrizando manualmente o espaço e depois forçando-o por força bruta. É muito caro, mas funciona. Pouco pode ser feito para restaurar a validade do benchmark aqui, além de aumentar a dimensionalidade do espaço das tarefas.

62

Melhores

Classificação

Favoritos