não é louco como cada token em um modelo de linguagem é um programa funcional que recebe todos os tokens anteriores como argumentos e retorna um token? sabe?