¿No es una locura cómo cada token en un modelo de lenguaje es un programa funcional que toma todos los tokens anteriores como argumentos y devuelve un token? ya sabes